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TTTTTTTGGT TGTGCTTGTT TAAAAACTCA ATCTCAATGT CGCCTTTAAA 47520 

CTTGGCGCTG TATAGTAGAT TGCTTGCCAA ATATTTTGTT TAGTTTCAAT 47580 

TTTTTTTCTT GGTCTTGAAA GCAATCGTCT TGTAGTATTA AGTAGAGGTT 47640 

GGCCCACTTA AAATATTTAT ATGCTTAACT CCTTCAACAT TTAGCAGAGC 47700 

GCTTCGTAAG TTGAGCTTTT GGGCGTGCTT AAGTCCTCTT TTAGTGCATT 47760 

CCATTTTCTT TTATTTTAGA AAAAAGTTCT TTTAAGACTT CTGATATTTG 47820 

CTTGAACTTG GAAAGTTTAT TATGTCGTAA ATTGAATTGT CTTTAATGTT 47880 

TTTGTTCTCA GTATATGTTT TTTTTCATTT TGAATTTCTT CTATTGTTTT 47940 

CCCAAGTTTT TATCTU^AAAT TATACTCATA TTTTAAAATC CATTTTTAAA 48000 

CTAAAAAGAA AAAATTTATT GTTATTGTTT TGTTTTTAAT GCTTGGCCTT 48060 

GGTCTATTTT GAGTTCTTTT GAAAGGTTTA AAAAAAAATT TTTAATAGAT 48120 

TGGCTTTGCA AAGTTTAAAG TAAAAGCTGT AGTCAAGCCC ATAATTTGGA 48180 

AACTGCCTTT TGGTGTCTTA AGGTAAAAAA ATAAACGCTG TTTTTGTTCT 48240 

CTATTAATTT AAGATCGTTG TTAAATACTA TATTAAATTT TTCATCAATT 48300 

TTTTTAACTA CCAAAGTCAT TTTAACATAT TTTATTCGAT ATTACTATAA 48360 

AATGTTTATT ATTTTAAATG TTGAGATATA TTATAATTTA TATTTTTTTT 48420 

ATTTAATTTT TAAAATTTAA ATATTTACAT AATAGTAATG TGTGTGGGAG 48480 

AATATTTTAT TATTTGTTAT TTTATTATTC TTTTCTTGTA AAGT^TTTAA 48540 

CTTAGGAGAA GGCCTTCAAA GGTTTTAAAT GCTTCTAATG GTGCATCAAA 48600 

AAAATT^TT TTGTAGATTC TTTAAATGAT GATCAAAAAG AAGCTTTGTT 48660 

CAGGTAGTTC TTGATAGCAA TCCCGACAAG TTTAATCAAA TTTTTAATTT 48720 

AAGGTAAAAG AAATGCTTGT TACTGTTGTT AAGTGTTTAA AGGCCAAAAG 48780 

ATGGCTCTTG AGAGCTCAAA TGTTGCAAAT GTTGCCAATG CTAAACAGCA 48840 

GTTGAAAAAA CTTACATAGA TAATTTGCGA CAATCTTTTA TGACTACTAA 48900 

GAGGCTTGTA ATCTTGTAAA AAATTATGAT GCATCTGCTT CGTTTTAACT 48960 

TAATTCATCC TTA6ATTAGC TCTTAAGCTT AAGAGTTAAT CTTTCCGTTT 49020 

TTGTTTTTTT ATTGTAAATA TGTCTAGATT TGAAAATTTA AATTTTTGTA 49080 

ATGTTAATGA TTTTAATTTA itTGTGTAAT TTTAGATTAT TAAATAATGC 49140 

TACTTTTTTG CTTTAAAAGG CATTATTAGG TTAATTTAGG CTTAAAACTT 49200 
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TATTTAAGCT ATTTTAAATT C?R»TTTTTAT TTAAAAAAAC AATTTATTAA^T5?5CAGCTGCA 49260 

AGCCTAATTC CTTTTATAGT AAGAAATAGT GCAATACATA CATTTAGTGT ATGTAAAGTG 49320 

AGCTATATTT TTATTTAAAC CAATAATTAA ATAGAGGTAA TTTAATTTAT GAATAAAATA 49380 

GGAATTGCAT TTATTATTAG CTTTCTGTTG TTTGTTAATT GTAAGGGCAA ATCTTTAGAA 49440 

GAAGATTTAA AAAGCACCAC TTCTAACAAT AAGCAAAATT TAATAAGCAA TGAAAAAAAG 49500 

TCTCTAAATT CTAAGAACAA TAGGCTTAAA GATTCTCGGT TAAGTAATTT TGAAAGCAAA 49560 

AAAAATGACC AGACATTAAA AAAATCCAAA GACTTTAAAA AGGATTTACA AACTTTAAGA 49620 

AATTCAAAAA ATTTAATGCC TAAAGACTTG GATCAGTCGA GTAATGATTT TGAAAATTTA 49680 

GACAATTCTG AGTCTTTGCA AGAAGCTTCT TCAAAGCACA ATATTGGCAA GTCAAGATAC 49740 

GGTAAAGCTT TGCTGAAAAA TGATCACGAT GAGATTTGGA TTCCCCATTT AAACTTGGAA 49800 

GAAGACAAAA ATTTTGAGTT TTTCAAGAAA TCTTTGCAAA ACGATGAGAA TAGATATGCT 49860 

CTTGGTGGGT GGCTTTTAAA CAATGATGAG GTGTTAGTAA AATACAGATA CAGCGAAAAA 49920 

GATGTTAATC AGTTTTTAAT TGATATAGGA AAAAAGCGGT GGGGAGATTT GTCTTCTAAA 49980 

ATGAGCACCT TGGTGCGATT GATTGGAAAT TATTCCGACA AAAGTGACAG AGAAGATGAA 50040 

ATTTCTCTTC TGGATATGAA TTTGTGTCAA CAATTTTATC TAACCAAGAT TAATGCTGGT 50100 

GGTTCAAGCG CAGACATTCT TGTTGCTCTT GAAAAAACAA TCGATCAACA AATTAGCGGT 50160 

GTTAGCAAAG AACTTCTTGA ATTAAAAAAT TTTTCTCTTA CTACAAAGTC AGAGCTTGAT 50220 

TGGTATTTAA ATTGGAAGCG CAATTTAACA GACGAAGAAG AAGAGACTTT GCAATGTTGC 50280 

AGGGTTTTGT TGGGCGGAGA ATTGGATTTT GAAAATCTTG ACGATTTGTT TAAAAGGCTT. 50340 

GGAAAGGAAT ATTCTAGGTT GATATTAAGA AAGTTAGAAG AAATAACATT AAATTACGAT 50400 

GTTAATAGGT TTTTAAAAGA AATGGAGAAA TCACGTAAAT CTTTCAAACA AGCATTAGGT 50460 

TCTATTAGGA ATAAAAGCAA AAGAGTAGTG ATTTTTAAGG TTAGAAATTC TCTTTTGGAA 50520 

ATTTTTAAaC TTTATTACAA CAATATTGGC AGGAATAAAA AACTTTATGA TTATATAAAT 50580 

CGCATGTTAA ACAGCTTGAT AAAAGAGATT AGCAGGCGTT AAAGTTTTTA TTTTGATTTT 50640 

TTTGTTAATT GCTCTACATT TTCTTCTAAT AATCTAATTT AAAAACTTTA AATATTAGAT 50700 

AGAATTTTAA AAGTTTAAAA GGGGGAGCAT TTTGAAAAGA GTCATTGTAT CCTTTGTGGT 50760 

TTTAATCCTA GGGTGTAATT.- TAOATGATAA TTCAAAAATG GAGAGAAAGG GTAGTAATAA 50820 

GCTTATTAGA GAAAGTGGAT?: ;CAGATAGGCG GGGTCAAGAA AATAGAGCCT TGGGGGCGAT 50880 

GAATTTTGGG CTTTTTTCTG GAGATTCTGG TGTAGTTTAT GATTTGCAAA ATTATGAAAC 50940 

TTTAAAAGCT CTTGAAAATA AAAATAAATT TATTGATTAC TCTAAAATAG AGTTTTTAGA 51000 
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AGGAACAAAA TCAATAAATG CTTTTATTTG GGCAGTTTCT 
AGCCAGAGAT TTGTTTGGGG AGTGTGGAGA TTTTATTAAA 
TTCTTATCTT GTTTCTCCTG TTGATGGAAG CTATATTTCT 
TTTTGAAACT ACTAGAGAGA GTGATCCGCT TTATTCTGTT 
CAAGGGAAAT GATATAAATT TTAATGAAAA. TAAAAGCGGA 
GTCTGAAAAA TCAGTTGAAT CTGGGCTTGT AACCGCATAT 
TAAAAAAGTG ATTGAAGCTT TTGCTTCTCT TTATAATAAT 
TGCCGAGATT ACTATTAAGT CAAAGCAATA TCCAAAAAAT 
GCTTGATTCT CAGCTTTTTA ATGTTGCTAT GAAAAAAATA 
AAAAAGTGCA AGTTTTGCAT TTAATTCGTT AATTAACTAA 
CAGTTTAAAA CCACTAGCTT TTTAAATTAA TTATAAATTT 
AGTGTCTTTA AGTTTATTAA GTGTGGTTTT GGAATCTGCT 
TCCGCTAGCA AGTATGCTTT TGTAAGTATT TAGCTCTTCT 
TTTATTTTCT TTAATTTTCG CAAGCAGATC TTTTATTTCA 
AAATTTTTGT ACAGATTCTT CTATTTTGCT TTCGTCTCCA 
GCCAATATTT GGATCTACTA GTTTTTCTTT TAATAAGTTT 
TTTTTCCGTG TTGTTTAAGT TTAATCTGCT TACTAATTTT 
GAATTCAATT CTATCTTCAT CAACTAGGTT TGATTTGGCT 
GTTGTTTGGC TCGGCATCAT TACTTTTGTT TTTGCAATTA 
AAATACAATA ATCGTTTTTT TCAAAATAGT. .CTCCTTAAAA 
TTAGTAATTA TAGCATTTTA ATAATATGTT TAGAACATTT 
TTAATTATTA AAAATATTGT ACTAATTTAG CATTAAAAAT 
TATTGCGTTT AAGATTTGCA ATGTTTAGTA TTCAGGAGGC 
GTGCATTTGA TAAGCCAACA GAGAAAGCAT TGGTGCGAAT 
GATTTTTAAT TTTAATTAGA TTATAAAAAT TATTATCTAT 
TTAAACGATA ATTGGAATCC GTTTATTCCA AGATCAAAAT 
TCAGCGCTGA GTCTTTTTTT AAGATTTTCA TTGTGCCGAT 
ATAAGTGAAA' CTGTGTAGGA TGTTAAAACC ATGCTTGCTC 
CCGGTTAATT GTGTTTCTCG GTGATTAAGA ATAATTCCAG 
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GTTCGTTGGA TAAAAATTAA 51060 

GAGCTTAAGG GCATTAAGTA 51120 

TATGCCATGC CTATAATAGT 51180 

TCTGGGTTTA AATTAAT7UVG 51240 

TTTTGGGGAA GACTTCCAAT 51300 

CCTTTTGGTT CTAGCGATGC 51360 

GGAACTTGGA GTGATATGAT 51420 

GAAAAAGTTT ACAGAATTAC 51480 

ATTGAAAAAT ATCGTAAAAT 51540 

AAAAATATTT TAAAAGCTAG 51600 

CAGACTTGGA TTTGCTATAT 51660 

TGATTAAAAA TTCCATCAAA 51720 

GGATCTTTTT CTTTTTTATC 51780 

TCTTCTTTTA GCTCTGATAG 51840 

CCGCTATTTT TAAAATGTAA 51900 

GTTAAAAATG TTAGTGTTTC. 51960 

TCTAAAGGTG TTGCTTTGCT 52020 

TGCGATTTTT CATCTAGATC 52080 

AGCATAAATG CTAATATTAT 52140 

AGTATTTTAA. TTATTATTAA 52200 

TAATTTAATA ATTGTTATTA 52260 

AATTTCTTTA TTAGGCTCAA 52320 

GGGGTTTAAC GATATTTTAA 52380 

ACTTTCTCTG TTGCCAAATT 52440 

TATTAATTTA ATAACTTTTT 52500 

TGGGCTCAAA GCCTGCAAGT 52560 

TTGCGAATGT AAATGGAATA 52620 

CTACCCCTAT TAATATGTAT 5268-0 

TTCCCCAAAG GATTGCTCCT 52740 
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AATAAATTAA ATCCAAGCAC^IaGCCTCCA CCAATATAAT 
ATTCCAAAGG GCAAAAATAA ATTTAAAAGG AATGGCCCTA 
TCATATTTGT TAAAACTTTC AATGCCTTTT TCAATTCTAT 
AAGATTTGAA TTGTCAACCC AAAAATTAAT ATTAATGTGA 
TTATCTCCTA ATGGTAAGTT TTGACAAGTA AAATATTAGC 
ATTAATOTAT TGCAAGCAAA TAAAGTTTGG ATTGAGCTCG 
TTTAAAAATA TGTAAGATCT TAAGAAGATA AATTAAAAGT 
TTTAATCTAG CTTTGAAAAG CAAGTTTTCA AAGTGAGCCA 
TTTGTGAGAA TAATACTATC TGCTAGTTAT CCATGTTATT 
ATTGTCTTAA AGCTTCGAAT TTTATTTATT TCTTATTGAG 
ATCTCTTCTT AAAATCTTTT AAGACCATTT ATTAATGGCA 
TATACTTTAA CTTTCTAATT TGTTTTTATG TTTATATAAT 
TAATGTTTAC AATTTTTTTA AAAAAAAGTT CTTTGATAAT 
ATTAAAAATA AAAATTGTAT TATGATTGGC ATGGGCTTCC 
TAATT 

(2) INFORMATION FOR SEQ ID NO: 5: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 35515 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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CCCCTTGGAC^lAAGGATCCT 52800 

TTGGATTTTT TTTCTCTTTA 52860 

TTTGTGTGTC TTTTGTGGCA 52920 

AAATTTTTTT CATGTTTTTA 52980 

GCAATTTATA ATAAATTAAT 53040 

TTTGCTTGCA ATAATAGATA 53100 ' 

AAAAGAAGAC TTTTTAAAAG 53160 

TATAATTAAT TCGAAATTCT 53220 

TAAGATTCTT TTGATCTTTG 53280 

CTTGGATTAA TCTTTAATTT 53340 

TTAAGCTTTT ATAATGTTTT. 53400 

TTTAAATTAT TAATTCAAAT 53460 

GTAGTAATTT TTATTTTTGT 53520 

tATTTTATAT TAATATTCTT 53580 

53585 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: 

GGTTTAGGAT CCTTAAATAC GTTGATCATG CGAAATGACA TATCAGAAAG TCTTTTCCTA 60 

ACACCATTCA, TTAGACAACC CCCACACAAG ATGGCGTTGA AGTTTCTCTT TTTAGTTTTT 120 

CTAAAAATGC ATCAAGTTGT GAACAAAAAT TCTTGTTTGA GCCACAACTC CCCTCGCCGC 180 

CTTCTTCGCC TCCACTGCTA CTAGGATAAT AATCAAGTTC AAGTTCATTG AATTTCTCTT 240 

TTTTGATCCT ATCAAATTCA AATTCTCGAA CAACTCCCTG TTTTCTTAAT TGGCAGCCCA 300 

.TATGGTAGAA AGTAAGTAAA AATATTTGTT CATACGTCAG TGAACTGGCA TCAATACCGC 360 

GTGTTACTAG AATAGCTTGA AGTAAGGATA AATGAAGTAG AAAATTTTGC CTGCTTAGTG 420 

CAAATTTGTC TATTCCTAAT AGCAATAACA CTTCTGAATG GAGTTTTGTT ACTAAAAGTT 480 

CTTCTTCTCC tGCAACTTGT GCTTGTAAGC TTTCTTGTTC ACTCATTTTC ACTTACCTTA 540 
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TACTTTTAAC TTTGCTTTAT GTTAACTTGC AAAATAGTTT TTCTAGTAGC TU^GTAGACCG 600 

CCTAAAACAA AATCAATGTA TGAATGAGCT ACATCGGTTG AGTCTTTATC AACTTGTTCA 660 

TTCGGTGTAG GTAGCATATA CTTGCTAGGT TTAAATTTAA TAAGTTCAGA ATTTAGTGGA 720 

TAAATGAGTA TTTTATGTTT CAGCAAGTTT GAAGTTTCAA TGTAAACATC TTCTCTATTA 780 

TTAATAGCCT TAATAGTTTG AATTAAAACA TCTTCCCATT TTTCACAACT ACTTGCTGCA 840 

• CCCTGTGCTG CTGCGTATGG TTTTACTAGT TTAAGTGACG TTGCTGGGTC AACTATTACC 900 

ATCATCGGGG TGGAAAATTC GTCGCCCAGT TCTAACTTTG AAAGTCCAGC CTCAATCTTT 960 

TCAAAGATTT TATCCATTTT ATCTTTATCA CCACTAGCAA CCTCTTCTTT TATCTGCTCG 1020 

GGCATATTAA GCAGCCCATA CATATTTGGA AGCAGGCGTT TTTGATTTTT CCCATCTTTT 1080 

TGAATCGAAA CAGTCCCGGT TAATACAAAG TGATTAATAA GTTTAATAAT TTCACTACTT 1140 

GCAAGCTTAT ACGCTTGAGC AAAAGGAAGT AAATTATTAT TAATGTCCCC AATATATGAA 1200 

TCTGAAGTAT AAAATTTCTC AGAAGTCTGC TTTAAATGTC TGAATTTATA CTGTAATTTC 1260 

AAATAATTAA GTCTTACCAC TTCAGAACTA AATCCAATAG TTGAGATAGT ATTAACCTCA 1320 

TTCGCAATTG TTGTAGGATT AGCATTTAAA AACGCGTCCC ATTTTACGGT TTTTTGATAT 1380 

CCCATTTGTA GATCAACATC TTCAATTTGA TCGGGCGAAA ACCATTTATA CATAATAGGA 1440 

TCTTTAACTT CTCCTATGAT ATTTGCCACA GCTTTTGCAT AATAATTTTC ATCAAATAAT 1500 

TCCATATTAA ATCCTCCCAA ATATTATTAA TTTCTACTCA TAGCTTTATT TCCAAATACA 1560 

GCTACTTTTA CTAAATAAAC CTCATTciiCTA ATTTGTTTTG CATCAGTCAA TGCTGTTGCA 1620 

TTAATAGTTG CTTTATTTGG TGCTCCAGTC ACCTTTTCAA GAGCACCGTC TTTATTAAAA 1680 

AyAAGTTTrT CTTTTA^^ CTAAATAkCC CTCAAAATTA 174,0^ 

TTGGTAATTG GCACAATAGT AGCTGTTTTA CTAAACTCAT CTATGTCAAT GCATATTCCA 1800 

TATAAGTCTT CACCTCCACC AGCCTCAACA TGTGGCTCAT AGTGACTTTG ATTATCTTGA 1860 

GCCTCTTGAA TAACTCTTTT TACTCCACGC TTGTACGGAT ACCCCAAAAA TGGATGATTT 1920 

TCCAATTTrT CAAACTTACT AGTTCTAGTG CCTCCAGAA.G CAAAAAATTc TACATTTTTG 1980 

TCTCTAAATT CATTAGAATT GCTAAGCAAA CTAGCGTCAT GTTGGGGATT TTTCATAAAC 2040 

TTTTCCAGTT TACTTCTTTT CTCTTGATAC TCTTTTACTA ATTGCGTTGT ATCTCCCATT 2100 

TATTTACCTC CTTTTATTCG CCCAAAGTTT AACCACCATC AGGtATTaCT rTyTTCTCAA 2160 

GGCCTCTATT TCCAAAAATT GCAACTTTTA TCAAATTAAT AGAATACTCT TGCCTAGGAT 2220 

ATCTATTTTG ATCTTGATTT CCATCTTCGG GTGCAAAATT GATTGTAAAT GAATCAGATA 2280 
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GAGCATATAT GTTAATTGCG^WTGGTGGCC CACCTCCrGC CTTGATAATA^fc^VCCGTTAT 2340 

TATTTATGTC TAGkATTTCT CCTATTTTTA TACTTGGATT CCTTGTrACA AGrTACCCTT 2400 

CAAAATTGTT AGTAATTGGC AATACATAyG CrGTACAACT AAACTCACAT ACATCTACAC 2460 

ATATCCCATA CATATCAGTA TCAGCTCCAA CTTCmACATA TATAGAGTTC TCTTTTGGAA 2520 

CAAGTTTAAC sCCrCGyTTG TATGGAAAAC TATTyGCTGG rTCGTAAAGG TATTCCTCTA 2580 

TTTTGTCTGT ATAACTTGAA CATGCAAATG AATATGCATC AACTCGCTCA TTCTTrGATT 2 640 

TAAAACArCy ACTTrAACyG CyAAAAACCT TATTTTCAAT TGAACTCATt GATTTTrmAT 2700 

ATTTyTTr/yV TTTyAAAAGr ACATCATCAA GCTCGyTAAT TGmCTCCAAA TAGGGATCTT 2760 

CCCCTTGTrC rTCCTCAGCT TGTCTTGCTT GCCGTTTAGC TCTAGGAGCA GCGGAAACTT 2 820 

GTGCCCCTAA ATCTACCTGT GGGTCCTCAA CAGCCTCAAG ATTTTCTACT TGCATGTTGC 2880 

CTTTTAAAGC CATAATTTAT TACCCTTTTA TTGCTCTATT CCCAAATACA CTAGCAAGCA 2940 

CTATAAATAA ATCTTCAGTT AATTTGTGTG CCTTTGAAAG TGCTATTGGA TTAACAGATT 3000 

TTTGAGCCCe AGTGACCTTT TCAAGTTCCC CATGTTGGTT AAAATTTAAT TTATCTCCTG 3 060 

GATTTACACC ATTTTGTCCw TCTTTCTTwA GCGTTAAATA CCCAGTAAAG TTATTTGTAA 3120 

TTGGTATAAC AGTTGCCATA CCGCTAAACT CATCTATATC GGAACACACT CCATATAAAT 3180 

CGTCTCCACC ACCAGCCTCA ACTTCTAGTT CGGTTGTTCC ATCTCCAAAA CTAAGCTTAA 3240 

CACCCCGTTT ATACGGATAC CCTTTAGCAG GGTAATTCTC TATTTTGTCT TTACTGCTAG 3300 

TGCAAACCCC ACCAGAATTG GAAAAAATTA GATTTTGGTC TCTAAAATCA ATAGAATTGC 33 60 

TAAGCAATCC TGAGTCTTGT TGGGGATTTT TCATTAATGC TTGAATTTCT GCAACTTTCT 3420 

TATCAAATTC TTGTTTAATT TTTGTTATAT CACTCATTTA AAAACTCCTT TAGGCAATAC 3480 

TTGTTCTTTT ATGTCTTTTT AGATTTTCAT AAAATTGAAT TCGTCTTTGC TTGTATGTAT 3540 

TACTTATCGC TTGTACAAAT TCTGTGAAAT TAATAGGTAC AAAATTAGAA TCAAGCAAAC 3600 

TTGCTCTTTC TTCTGATTTA ATAGCAATAT TCCCCTTAAT AGAGTCAACA GAAGAAGAAC 3660 

TGCTACTCGC ATTTTTTCTT AATTTAATAT TCACTTTTGC TAAAGAAACA AGTTGCTCTA 3720 

ATATCTCTCC ATCGATATGA CTTATGTCTG ATACTTTGGC AATAGCTTTA ATTTGCTCAA 3780 

TTGGAACGAA CTTGCGTACA AGTTCTCTAC GTTGTGCTTG CATAATGTCT TTTAATGTAT 3840 

ATCCTTTTGC AAGTAGCACC TCTTTGTTAA AATGATTGCT AAGATGTGCT TTTGCAAGTG 3900 

TATCAATTTC ATTAATTCGC TCAGCCTCTA GTAACAATTG CTTTTCAATA CGCTCCCGCT 3960 " 

CTTCAACTTC TGCAAGTTCT TTTGTTATTC GTTCATTTAT ACTTAAATCT CGACTTGTCT 4020 

CTTTAGATTT ACTATTTGCC TGCTCTTTAA AACGCATGTA CTCTTCAAAT TCCTGCrCAC 4080 
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TkATAACTTT AGTATCAGCC TTAATTTGCT GCTCTTCTTT ATCTTGTGCy TGCAGGTCTT 4140 

CTTTTTCTTC TTTCTCAGTC ATCTTTTAAC TCCTTTTCTC AAAATGAGAA TAATTTCTCT 4200 

TTTAACATCG CTAGCTCCTC ATTATTAAAT GAGCTACTTT GTATAAGCTG GTTATATTTA 4260 

CTGTAAAGCT CAATTAGCTT TATATCTCTy TCyACTTTTT GTTCTTCACT TAACATAATC 4320 

AGCGAATTAA ACTTCATATC AAGCCCAAAA TACTTTGTAA GTTTTAAATT ACAAGAGTTC 4380 

TCAACTTGTT CTTGTACACC TTTGAGAAAA TCGTAATAAT TACTCCTATC ACCTTTACCA 4440 

TCATTTCCTA GyCCTTTAGC CTGCTCATTA AAACTTCTGG TTAAGGGCTC TTTAGTATCT 4500 

GCACCAATTT TTGCCTTAAT TAATGCTAAA GCCTCCTTTA AGTAGCTAAG ATCGTATTTA 4560 

ATAACCTCTA AACTAGCACT AGGGGTGGCC GTATAAAACA TTCCCTCATT ATTTAGATTG 4620 

CTTTTTAGCC TAGCAAGCTC CTGTGATAAT GAGTCATTAA GGTTTCTTAA ATTAGAAATA 4680 

TCTTTACTAT GATTGTTTGA ATTTTGTTTT CTCAAAAAAG AAGATAAAAT GCCACTTCCC 4740 

CTATCATTAT TGCTCTGAGT AAGTGCACTT AAAG7UVGTTG TTGCACTAGA rAGTGCGTCT 4800 

TGTAGTTGTA CTAAAGATTC ATCTTTGTAA AACAAAAAAT TGTGGTTTTC AATACGTCTT 4860 

TCTATTTCTA CGTATATCTT TTCAAATAAA TAAATATCTA GTAAAAAGCT TTCGGTATJ\A 4920 

CACGGAACAT ATCTTTTTAA GATATAATCA AAGTTTTCAT ATATGATAAG TCGACTTTTA 4980 

TGTATTTTAA CTGCGTCTAA AGAATTGTTC TTATTGTTGG ATTTTACTTT ATAGGTTATA 5040 

TGATCAAAAT CAACTCCCAA ATCTCTTACA TATTCATAAT CAAGGTATTC AAAACCAATA 5100 

GGTAATTCTA TATTAACGGG TTGTTCGAGA TCTATTAGGG TATCTTTGGT TTTTACTAAA 5160 

ACATAGCCAA TCCCATGAAA ACGGTAGCTT ATAATACAAT TAAGCAGAGG ATTCTTAAGC 5220 

TGTACCTTTA ACCTAGCAAG TTCAACCTqA CTAACATTGT GGGCAGCACT CTCAAGAAyA^ 5280 

AGTCCGTTCT TGAGACAATC TTCTGCTACA TTTTCAATGT AATTTCTAAA AAATATTGAG 5340 

TATTTGTATA GTTCTAGTGA ACTTATTTTA TCTATTAGTT TTGTTTTTCT TAAATCACAC 5400 

ACCTTTTTAC TTCTCTTTAT TAAATTAGAT GyATGATAGC AAAAACTAAT ATTTTTGTCA 5460 

ATAAAATTTA CAAAAATCTT TGATTGCCAA AGTGAACACT TCGCTCTCTA TATCCTAAAG 5520 

ACAACATCAA ATATGCTGCA GAyATTGCAT CAAGAGCATC ATCATGGGTT TTGyTATCCC 5580 

CCTTATACGA ATAAATATCA TTAAATACAG AAGAACTACT GTACTTTGTA. ATrTAAAGTT 5640 

TyTTrTAAGT AAACGGCGTA ATTAACGTTG TTATTCTGCT AAATTTATTA GACTTTGGCT 5700 

TAACTGGAAC AATTCTAAAA TATTGGCTTA TATTAyTTCT TAGCAAGATG TATTCrCGGG 5760 

TCAATCCACC AGCACCTTTT GTATTATCTC TATCCTCTAA ATACAGTGTA TGCACATTGA 5820 
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AATTTTCTAT AACrGTCTri^ScCATATTCA TAATATAAGG ATCATTrGCI^SGTCkTTGGT 5880 

CTTGAAATAC AAAAGCATAA TACTTATCAT CAACTCGCTC CATAACACAT AATGCAGTGT 5940 

TATCCCCkCC AACACTAAAT GCTGGGTCTA AATATGCTAT CGGGCTAGTA AATACATAAT 6000 

CATyAGTAAT ATTTATTTGT GTAAAAATTG AATCrGTGCT TGCTATCCAC TCACCTAGCA 6060 

AAACTCTTGC TTTATATGAT GGTATATCTT TATAkAGCTT TTCTTGTGTT TCGAyAAATC 6120 

CTTTACTAAG TAGmACATTA TCATAAGTTG TAAAATTATA TGTCTTAAAg GTCGCTATAT 6180 

TATCAATATA ATCGGTTTTA AAATAGTGTT CTGGATGATG rGGATTAGTA TCAAAAATAA 6240 

TAGTTTCTTG CCCGCATCTT AGTCTTTTTA AGACyTCCTC TAAAGTTTGC TTGTGTAAAG 6300 

TTGTAGCCTC ATTAACAAAA ATAAGTGCyG AATTACTTCC CCTAAATCTT TCAAAATCAC 6360 

TTGCCTTATC TCCACCATAT AGATTAATAC GTAGTGAATC AATCAGAATA TATGAATTAT 6420 

TTGTATGTCT TGGAATATAA GGAATTTTAA GAAGTTTACA TAGCTTTTCA AATTGTCCCA 6480 

AAACATTAAC TTCAACTGAr CGTTGTGAAT TCCCwATAAT rAAATTATTm GTATCrCTAG 6540 

ArTATAACTT TTTATTTTCA ATTAAACTTT TkAGAAAAAG ATArCATGCA AGATACGTTT 6600 

TGCCrCTAGC TATGCCkCCG CTGAGTATAA TCTTyTTTTC ATTATTCTTT TTAATrCTTT 6660 

TTATCACATT TTTTTGTTTT AAAGTTAACT GTTyTTCTTC AAACTTATCA AAATTAATTG 6720 

AAGAATTTGT TAGCTTTACA AATTGTGATA TATCAACTCC ATATTTATTT TTGTATTCCT 6780 

TTTGTAGTGT TGTAATU^GT TTTGTTTGAT ATAAGTTCAC TTGTGCCCTT TACTATTTTT 6840 

GTAGTTrCTT TTGCTTTCAG CnTCaTTArC mGTwGyAAGT TTTTTCATAC ATTCATAGTA 6900 

AAGCTCCATT TCTCTTATTG AACACTCyTT TATATATTCA TCAAGCTCGC TTTTTAAAGA 6960 

ATTAATTTCT CCATTAACAA CTTGCTTGTT TTTTTTACTA CTTGCTTTAT TTAAAGCGTC 7020 

AATTTCGGCT CTTAAATTTT CTATTTTAGT wyGCATACyA rwAAGyTCAA CACTAGAATA 7080 

TTGCTTAAAT GCACGTATAA ATCCTAATTy TAAATTAGcA CrCTCTAyAT CyAATTCrCT 7140 

TATAACTTTC CTAGCGTTAA CTTCTGATyT AAArGTTTGy GATAAAAGGT GTTCTAAAGT 7200 

ATCTTCACTA ATTGTTACTC TAGAGTCyys GTTAACAACA CTTTCTCCAC TTTCCCAyTT 7260 

TTGTCtCATT CTCCACACAT TTACTTTAGA AACTCCyAAT TTaTyCGCTA TTTCTCTATC 7320 

ATTTAACGAT CCTTCTCTAA AATAyrCAAC ATAATCATCA AAAGrCCTTT TAAGTTTTTT 7380 

CAAAAmAATT tCTCCTAAAA TAACAAAATT AACAAcTTGT TACTCTAAAT AGTAAAkCAA 7 '4 41) 

TTTGTTAATT GTTAACATAA ACTATTATAT TTTTGATGTT TATTGATAGA TATTTGATAT -7500 

TTATTGTCTT TTATTAATTT AGAAATAGCA ATTACCTAGT TTATTGAATT TTGGAATAAC 7 560 

CTGATTATAC TAATTTGGAA AAATCTTTTA TTGTTTTTAG AAGATACTTC CTTGTGCAAA 7 620 
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TTCCCTTATC ATAATAGTGC ATGATTATAA ATAATATCTC TACAAAGTCG AGAACCACAT 7680 

TTATTGATTC TCGTTCTGGA TCTTTATTAC CAATCTCATC CATAATATTA GAAACAATAC 7740 

TCAAAAACCG GGTAGAATAC TTCTCACCCA TCTTTTCCAA ACATTTTTCT AGCATTCCTT 7800 

TCTTGTAGCT ACAATCAAAC TTCCTATTTT GGAAATTTTT ATACTTTTCT ATTATATGCT 7860 

TATCTTTCAG AAGGTCTTTA ATAAAATTTT TTGCAGGATC TATAATATAA TCTGCGATTT 7920 

CATCAATACT TTTTCCGGTT TTTCTTTTGT ATTCTTGTAT TGATACAAAA CCTCTATAAA 7980 

AATCCTTTTT TTGTTTCAGA GTTAATTGTT TAACTCCATA AAGTTTGCTT ATTTCCTTTT 8040 

TTGTGCCTGG ACTCAAGCAA TCATAAAAAT CTGAAATCTC ATTTATATTC ATCATAACTC 8100 

TAGAGAGTAT ATAAATAAAC AATATTTTAA ACAATAGTTT TTGGCACTTT TTGAATGAAA 8160 

ATTTTTATAG AAAACATTTT TATATTCACA ACAATGAAAT CTACAAAAAA ATAGCGGCTA 8220 

GTTTAT^/U^AA TAACCAGCTG CTATTTTGTG TATATAAAAT TTAGTTACAT TTAAAGTTCT 8280 

TTATCAATAT GAATTACTAT CCTCAATGTA TCCTTTAATT TCTTCAAAAT TATCTTCATT 8340 

TTCAAAATAT TTTTTAACTT CTTCTAATCC TGATTTTAAT TTTTCTAAAT CTGATTGAAT 8400 

ATCACTAACA TTTACATTTT CTTTTAAATT AGGCTCCTTT TCTAGAACAA TATATGCTTT 8460 

ATTACCCTCA TTTAATTTGG TTCTTAAATT ATGTCTAGTA TCACTCAATT CTTTCAATAA 8520 

TTTTCCTAAT TCTTCGCCTT CTTCATCCTC TAAATCTCCC CAAGTTTTGT ATATAGCTTT 8580 

ATTCCCATCA GTAAAATCAT CATATACAGG CCCCGTAATT TTATCTATAA CTTCTTCTGC 8640 

TCCTACAATT GTTTTACCAT TTATACCATC AATATCCTTA TTTATTTCAT CTATTTTGTC 8700 

TGTAAGTGTT TTAATTTTAT ATTTAACTTT CTTTTCTTCT TCTTGTTTTT GTTGTTCCTC 8760 

TCTTTCTTGT. TTTTCTTTTT.CT^TTTAA CCTAGCTTCT ^TCCTGTTGTC tTTTTTGTTC 8820 

TTGTTGTTTT AGTCGTTCTT CTCTTTCTCT ATCTGCTCTA GCTTTTGCTT CTTCTTGTTT 8880 

TTGTTGTTCT TCTTTAGAGT TTCTCTCTTC TTCTTTTTGC TTTTGACTTT GCTTCTCCAC 8940 

TTTTTCTTTT TTACTATCTT GTTCTTCTTT TTTCTCCTCT ACAACTTCTT TTTCTTCCTC 9000 

AACTTTATCT TTAGATTCTT TTGCTTTTTG GTCTTCTTGT TGACCACCAC TTTGTGCTGC 9060 

TGCTTTTACT TTTGGTACTG GTGGATTGTC ATGACTATTT TCCGGCAATA CTGGTAACAG 9120 

TGCTATTGCT CTGTTATTAG GATCATCGCC CTGCATTAAT TCATTATCTT CATCTTCTTC 9180 

TTGTAATTTT TTTGCTAATT CATCTACTTT TGAACTACTT GAAGTAATTT TATiCTTTTGC 9240 

TGGATCTAAA ACCTTATCTA AAAATCCTTT AATTTTCCCT TTTGCATTTT GTTTtATATC 9300 

TTTACCAGTT GCATAATTTT TACAAGAAAT TATAAGTGCA AAAACAGCAA AAATAATCAA 9360 
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TATTTTTTTA TTCATACTT^^TGTTTTCTC CTTTGTTTTG AATTTCTATC^TAAAAGATA 9420 

CCACTGTTAT TCTTTTTTAT CTTCTTCTAT TCCCTTAAGT TCTTCTTCAA TCTTTTTAAG 9480 

AGAATCATCT ATAACTTTGT TTGCTAATTC ATCAGTATTG CTGTTGTCAC TGCCGCCATT 9540 

AGAATAACTT ACACCCAAAC CTAATTCATT GGCACACTGC CAAGCTTGCA CTCCAACACC 9600 

ACCTCGGTTT TTAGACCTGT CGCCTTGAGT TTTCCCAGTT GAAGTATCTA CTTGTTTTTT 9660 

ATATTCTTCA AATTTCTGTT TGGCCTCTTG TAAAGCTTTT TTTCTCTCCC CCTTTTTCTT '9720 

TGCTAAACTC TCTTCAAGCT CCTTAAATTT ATCTTCAAGT CCTTTTCCTT TCAATTTTTC 9780 

TTTTATTTTG TTTATTTTTT CTTCATACTC AGAATATGTT TCAATAGAAG TTTTTTTAGA 9840 

ATCTAATTTT TCTATTTTAT TCTTTAATTC TTGAATTTGT TTTTCAATTT CTTTTGTATC 9900 

TTTTTCATCT AATTTAGATA AATCTTTTGT CTCTAGAATT TCTAAAAATC CTTCAACTTG 9960 

TTTTTTTATC TCTTGTTCTG TTTTTTTTAC ATTTTGTTCT GAACTTTCTA GATTTTGTTC 10020 

TGAATTTTTT AGATTTTCAC CACTTGCATA ATTCTTGCAA GAAATCATCA ATGCAAAAAC 10080 

AGCACAAATA ATAAACATTT TCATTTTCTT ATTCATAAGT TACTCCTAAA ATCCTTAAGT 10140 

CTAACGCAAT GCCTAATAAA TACAATTTTT CAAAGATTTA AATATATAAT TTTGTTACAT 10200 

TCAGCTATCA CATATTAACA AAACGCAAAT ATAATTTTAA CCAACTCCCC AAAATCTCTC 10260 

CATTGCAAAT GCACCACTCA TTACAAAAGA CTACAAAATC CATACAACTT AAATTTCAAA 10320 

GTCTTTGCTA TATATTAGAT AAAGTATACT GTCTTTCTTA TCCGACACCC TCAAAAAATG 10380 

CCTATTCTGT TTATCACAGC CACTCCACAA CCCAAATTTC GCATGCAATG AGAACACCCA 10440 

AAATTTGACT AAAATTTTAG GTTTTTGATA AAATATAAAT TrCATTTTTA TTAAATTTTT 10500 

ATTACTTTTA CTTAATTTAA AAGTAACACT TCTAAGGAGA GGATTTTATG GATATTAATA 10560 

ATTATTTTAA TTTAAATAAT TTCAATATGG ATTTTATGCT CAAACTATTT CAAGATTATC 10620 

AAAATGTGGT AAATGAAAAT AAAATTCTTA AAAATTCACT AAAAATTTCT TCTAAGCCTA 10680 

CTAAAAAAGC TTCAAAACCA ACTCCTAAGT TTTATTTAAC CTCAAAAAGT AGCAAAATAA 10740 

TTGAAAAATG CGTyAAAACA TTAAAAmAAA yTGACCCwAT TTCTGGTTdG TTTCTACATC 10800 

TACTCGCAAT AAGTGGGTGy AGGGGkGCmG AAATTCAAAA AGTwAAAATG CAAGATATTA 10860 

CyCCkCTAyT AArCAAAACT GGAGAAACTT TyTACAATAT AAAAGTAAAT rTAGCTAAAA 10920 

AAAGAAATrT CACTTGyATT AGAGAAATTG TCATCAAATC TGAAGAATTT GAGGCTATTC 10980 

AAAAAGCTCA CGAAAATTAC TTTAATGAmA AAAATCTyGA CT^AmGGCGT ACyTAyCTTT 11040 

TCCAAAAAAC CAAACATAAA TTTAAAGATA ATCAAATTAG CATTATCAAT ATTTCTAAAA 11100 

AATTTAAAAw TCTTCTyAAA AAATCAGGmT TTCGTGCTAA TAAATCTCTT GATTTATTTA 11160 
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GAAATTTrTT TATTTCAwAT TTAAAATCTA ATGGyTATAA yTCTTTCCAr ATTAAAGAAC 11220 

TTATGAAATA TCATTCAACt tCmgAAATTG ATAATATTTA TGGACTCTCT GCTGCTAAyA 11280 

AAATTCACGC TTATAAATGC ATGAAAAATA ACCTTAAACT TTAAAAAAAC TACTTTAGTC 11340 

TAAATATACG CTTTGAAGTT ACTTTAAATA TTTTCCCACG AGGyTTCAAG TCAAGTGAAT 11400 

CATATAATAT TTCTTTATTT TTTGTTGCTA TAAAGTCATA TCCATTAACC TTATCGATTT 11460 

TAACTTCACT TATTTCAAAT TCATTGGCTG CACCTAAATA ATTTAAAGAy TCATATCTCA 11520 

CGCTACTTCT AATTCCGTAA TAATTAAGTA TCATACATGG ATTTATAATA AAACAATTrC 11580 

TCTTAATrTA TCCAAGTCCT ATAAATCTAT AATACGCTGC ATTTATCTCA TAAGCATTAA 11640 

ATTCACGTTT CTTAAATAGr CTTGTATAAT AATGTAGACA CAAAAAGTAA CAACCCCATT 11700 

TTTGTATCTC yGGTCTTAAA GTTCTATTrT CTTGTTTTAT TTTATTAATA AGCATTAATT 11760 

AATCCTCCTA TATTAAATTT ATTTTTTTAA TTTTTTAGTG CACCCATTCA CATGGGGACA 11820 

CTAACACTAT TTGyAAATGC TATATTGCTA GGGAAAAATA CTGTACCACT TGTTGGTAGT 11880 

AGTCCCTTyA ATCTATCTGA TATTGCCCTT TTCTTAGGGT CAAGAGTAAA CACAAACTCT 11940 

CCAAATTTAT AATTTAACTG CTCAATTAGT GGATATGTAT TyGTAATATT GTAAATTAGC 12000 

ATCTTCAACC TATCTTTAAT GGGCTTTTCT CTTTTTTTAT TTTCGTTTTG GATTCTATTT 12060 

AATTCTTTTT GTAGACTATC AATCTCCATT AAATCATACG CAAGATTTTC AGCAGATTGA 12120 

TTATCCTTAA TTTCAAGGTC TGyACT^TCA ACATATTCTA TAAATTCTCT TGCCCAATCA, 12180 

AACTCAACTC CAGAACTATA AAAATCACTC CTTTCTACTA AATCTTCAAC AAGTTTTATA 12240 

AACGTATCCT CGTTAAAATT ATGTGCCATT AAGTATTCCT CTCTATAGTT ACTATAAATA 12300 

TCTTTTTTCA i^TTTATAAT TTCTAATTCA CATTTATTAA CAAATTCAAA CACTTTTGAT .12360 

ATTAAGGCCT CATCTCTTTT AATCTTACAG TTAATTGGTG CAGCATCTAT TAAAAAGAAC 12420 

AAATTACAAT ACTCAAGCCC AGTGCATGCT AGCTGCATTT GTGCTTGTAy ATAATATTTG 12480 

AAAAAATATT TACTGCTTAA AAAATTGCCA TTTTTATTGT ACTCAGCAAT AGCACTACTC 12 540 

ATATAATTAG AGTCGCTACT TTTAATCTCT AATAGTTCTA AATCGCCATT ATTATTAATA 12600 
AACCAGCCAT CAATTGTTGA GCCCACTAAA GTTTCTGAAC TGCCCATTTT TTTGAAATAA ' 12660 

TTATACTTAT CAACwCCGTT GGCATATTTA TTTTTATATA AAATATCAAT ATTATCACCG 12720 

TATGCTTTAA CAAACTCTCT AAATCCTAAA TTCTCTAACT CTTTGCCCTT GAGCATATAT 12780 

AAATTCTCTT CAAAAGGTAG rCTCATATTA AAATATTTAA GCACTCTGTT TATCATTAAA 12840 

TCTTTCAGCC CAGCACCTCC AACAAGAATA TTGCCTACTT CACTAGCACC GTATTTATCT 12900 
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AACTTGTTTC 
CTTATTCCTG 
GATTTTTCCT 
AGmTCTCCTT 
CTCCTTwTwT 
AAAAwTTTTr 
AACCCAACTT 
TATATATGTA 
TTAATAAAGT 
TAATTGAATA 
- CTATTTAAAT 
TAAGTGTTAA 
TTTTACAATA 
TGGCCCTAGA 
TTTTTGATTT 
GTTTAAATTC 
TTTAGAGTCT 
GTTTAAATTC 
CTTAATGTCT 
TTTTAAAAAT 
ACTAAATCCT 
CAAACTATTC 
TTTAATTATT 
ATTACTTTTA 
TGGATTTTGT 
ATTGTAAATA 
TGCTAATTTT 
ATCAAAACTT 
TCTAATACTT 
TAAATCATTG 
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tttgcacactTDvaatcaata 
gtaatttctt acctatctta 
CAAwTATTTC acaaccagta 

GAATATTTTC TTGTGGATTA 
TgTAAwAAaT AAnTATATAG 
yAAAAAAATA GTTGGGyTTA 
GATTGGATTG TTTTGATAGC 
TATATATGTA TAACAAAAAC 
TAGGGTTTAA TCAAATTTGC 
TATTmTAATT TAGAATTAAA 
TCTCTTGTTA AAAAATTCAA 
TTrATAATAC TCTTyATCAA 
CATTATTATT TGCCACCTTG 
ATTGCTGCTG TTATTATCAT 
AAACTCTTTT CTACATTGTC 
TTTTCAACAT TGTCTATTTT 
AAATTATCTA TTTTTAGATT 
TTTTCTACAT TGTCTATTTT 
AAATTAGATA TATCCTTTTG 
.TCAAAGTTGT AATTATCATT 
ATCTTTAAAA ACTCATTTTT 
ATAAAATCTC CATATTATCC 
TCTTTTCCAT CACTAAATAA 
TAAAAATCAT AACTTTCTTG 
TTTGATTTTT TTACTATTGG 
CCATTTTCAA TTATATAATC 
AGATATATAT AAAGTTGCGT 
TTATAACCAT GAAGTTTATA 
TCGACCTTAT AAAAAATTTT 
TAATGAGCAA ATATCTCCTC 



839 

TTkCGATTAA ATCTAAAAC^^^TTGACTA 
CTTAATTTAC TTTTTTCTTT AATGGGAGAA 
AAACTTTGTT GATTAAyACT TATCATTTTG 
TTATTGTTTG AAAGATTTTC CATCTTTTTn 
CAAAAACTAT TTTTGcCAAg CTTTTTTaCA 
TTTAAATTCT CTTrTymAAG AACTTAGCTA 
AATAAACTTT TTTAGCTATT TACATACATA 
TATTTTTGAC AACTTTTTAC ATAAATTATT 
TTATTAAAAT AATTTAAATA AGCTTTTCAA 
ATCAATTTGT ATTTGTTAAA ATAAAAGAAC 
ATAAGTTCTA ATTTATGAAA AAGCAAAAAT 
TATTATAATG TrCCATTTTA AAAAATCAAA 
TAAATATTTC ATAAATAGGG CATTCAAAAT 
AAAATGTACT AGTCTGTTAC CCATGCTAAG 
TATTTTGATA TTCAAGCCAT CCATTTTTAG 
AGTGTTTAAA TTGTTTTCTA CAGTATCTAT 
TAAATTCTTT TCTACATTGT CTATTTTAGT 
AGTGTTTAAA TTGTTTTCTA CAGTATCAAT 
TAAATTCTTT TCTACATTAA TCAATTTTTC 
ATGCAGAAAA ACAAAATCTA TTGCCTCTTC 
TATACTTTCT ATATTGTATG TTCTGTAAGT 
TTTTAATTCT TTATATTCTT TCATAAGTTT 
TTTATCTAAC ATAAACCCTG TAAATTTAGC 
CTTTTTAAGT TGAAATCTTA AGGGTTTTAT 
GGTTTCTTGA CTCTCTATTT TATCAAGAGA 
TTCATTAAGA ATTCCTGCTT GTAATGCTTT 
TCTTGCCAAT TGATAGTCTT TTATAAAAGC 
GTATTCATTA TCTTTGATTT CTTTTAAAAT 
CTTTTTTATA TTAGTCTTTA ATCTATTTTT 
TTTGGTAATT AATTTTTTTT CACCGTCAGa 



12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
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TCTGTTGCCC TTGATATAAC TCTCTCATTT AATTCTATTT CCATAATAAA CCTCTTTTAT 14760 

TTGAAATCCA TACGGATCCG TATGGATTTA TTTAACATAT TCATCATATA CAATTi\AAAA 14820 

TCTTGATAAT ACCCCTTTAT ATTCATTAAT ATAATCTTTG GTCATATCAA ACTCTTCATT 14880 

TTTAGCAATT TTTTTATTTA AATCl'TCTCG TTCATGGATA AATCCCAAAA ATCCTGTCTT 14940 

AGATTCAACG TGTTGyAACA ATTGCTTATG AGTATTGTTT TTCTTAAATC GTGTTATAAC 15000 

CAAAAATATT GGAATTTTTA TTTTTAAATT GTTCATATGA AATTCCAATA ATTCTAAACT 15060 

TTCAACCX3CC CATTTTTCCG CAGTCATTGG AACTATTATG CAATTACTAG TCATTAAAGC 15120 

ATTTGACAGA GTGTAATCTA AACTAGGATT AGTATCTATT ATTACATAAT GATACCTCCG 15180 

CTTTAAAAAT TCTAAATTAT TTTGCAACCT TAACTCTTTT AATGGTATGG ATTCGCTTAA 15240 

AAATTTATTT AAAGTTAAAT AACTGGGGAT TAAGTCTAAA TTTTCTTTAA TCTTTACAAT 15300 

TGAATCATTA ATATCTATTT TTTCTTTTAA CACTCTATAT ACATTAATTT TCACAATATC 15360 

AAT ATTTTGA TTTAAAATTT CTTTATAAAA ATAACTTGTA GTGGATGCTT GTGTATCCAT 15420 

ATCAATTAAA AGAACTTTAT GCTCTTTTGC AAGCAATGTT GCCATTATAA TAGCACTTGT 15480 

ACTTTTCCCA ACACC6CCCT TAATTGACGC TATTGTkATT ATTTTAGGTT TTTTATTATC 15540 

CATTTTATTA ACGGTCCTTG TTCCGGGTAT TTTTTCCCAT AAAATTTATA TACTTGTTGT 15600 

TCTAAATCCG TAAACATACT AAATAAAACT TTGTTGTAAT GATTATTTGT TCTTTTTTTA 15660 

TCTAATAATC GATATAgCCC tTTrAAATAG CAAAAAACAC TTCCGGCTTT AAATCTAAAT 15720 

TCCATATAAT ATGCCCTTGC TAATGCATAT GCTTTTCTAG CCCCGTTTAT TTGATACTTT 15780 

ATTAATGGCT TTTTTATTGG TTTTCTGTAG CCATAAAAAA TACCAATAAA CTTATCTCCT 15840 

TCTTTAATTG GGTAyAAATG AGTTTCTTCA ACAATTCTTT CTCCATTAAA. TAAGGCCCTC 15900 

AATGATAATC TAAATTCGTG TTTTTTCTCA TAAACTCCAA ATTTATAAAT ATCCATCATT 15960 

ATTTTTGTAT GGTACATTGC TTTACCATTT TCTTTTTCAA TyAAAATAAA GCGTTCTTTA 16020 

TTTTGGCATT CAACTTTACA TTTACCTTTT TTTACAGTTT CAATAGGTTC TGGTGCAnTT 16080 

TCCATGTTAA ATCCTTATAC GGCCTTTATG CTAAATTCTT CTGTGGTTAA AGAATTTTTT 16140 

TCATTTTTTA TTATTTCTrA TAATTCAAGA TGATATrTAC CAAATACTTT ATTGTATTCT 16200 

ATTTTCTTTT GGTTATTCAA ATATTyTTTk AyAATwGGGT TTAGAATTTC AATATTTGTT 16260 

TCTTTTTTTA GTTGTTCAAT AAGGATATTG AAAATATTTT CCTTTAAATT TTGATAATTT 16320 

TGTTGAGAAT T?TTCTTTTTT TCTTTC/^TC GACTTTTCTA ATTTACGCTT TATATTGTTT 163^0 

AAATCGCTAT ATTTATGATT TTCAATAATA AArTGGGGCT TATATTTGTA ATTTTCGTAT 16440 
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ACTTTTTGTA AATTTATTTC TAATTGTTTG GGATTGTACC CGTTTTCTTC TAATTTTTTC 16500 

CTAGTGTTGT ATAGAATTTC TTTTAATTTT TTTTGTTTTT CTTTCATGCA AGATTTTTTT 16560 

ATATTGAATT TTTTTATTAG GGCAATTTCA TTTTGTTTTA AGATATTTAT TGCCTCAATC 16620 

TTAGTATCTT TATCAATATT TAAATACAAA ATAGAAAGAG CTTCTTCCGT TTTAAAGTTA 16680 

CAATTATTGA AATAATTTCT TAGTTGATAT TTTTCTATTT CTTTAATCTT TCTTTCTTCT. 16740 

TTTATATTAT TTTTATTACT TAAACACTCC ACTGAATTTA CACTACTATT TTTrGAAACA 16800 

TTGTCTTTAA AATGkTTATT AACTCTAGAT TTAAATCTAG AGTTTTTTCG TTCTTTAAAG 16860 

TACTTGTTGA TTTTCTGGTA ACATTCTTTT TTAGGATACT TTAGCTTATA GTAAATTTCA 16920 

GTTCCACAAT TTACACCCAT GTGTTGGTAG TAATTAGTTG TrACTTTTAA TACTTTTTCT 16980 

AATTTGTAAA GATAATTTTG CATTGTTCTT AGTGTAGTGG GAGCTAGACC ATTTCTTTTT 17040 

AGATTTTCAT TAwAGTAATA GAGTATGTTT TGTTGyGTGT ATTTCTTATC TTTTTTGTTT 17100 

AGAwAATCTA GTGTTGAAGT AAGAkATATT AATTTGTGTT GGTGTTTGTT GTrGCAAGTk 17160 

GGAnTTTTTG TrkTATTTrr AAAACCTTTC ATrTTTTcTC cTnTrTTTGt ATTAATrmTT 17220 

AnTATTATAA TGCAAAATTT TGATTTAAAA GTAAATACTT TTCTAAAAAA ATATTAAATT 17280 

TTAATTATTA ATTTTGTTAA ATTAATATAG AAATTTTTAA TTCAGTGAAA ATATAAATTG 17340 

ATTTTAATTc TAAAtTGGGC TACAATACAA ACAGCGTAGT TATTTGAACA TTTTTCAGTT 17400 

TTAACTACCT GTTTTTTCAA TTTACAAAAA AATTTTTAGC ACGGGCTTAA CTAATTTCTT 17460 

TAGTAGATAA TAGAGAATTT AGCTAAGCCC TATTTTTTTG TAAAAATTTT TGTAAAAAAG 17520 

TTGGCAAAAA TAGTTTTTGC TATATACTTA TATTTATTGA AAAAACAGGA GGAAAAAGAT 17580 

GGAAAATCTT TCAAACAATA ATAATCAAGA AATACAAAAT AATATTCAAG CAGAAATAGA 17640 

CTTTTTAAAT GATATGGATA CTTTAAGAAT GAACTTGCCA CTTATTGACA AAAGTCTTAA 17700 

AGGATACGGA TATAAGTATC AAGATTTCAA TGTCATAGTA GAAGTAATTC AAAATGTTAT 17760 

AAAAAATCAC AATTTAAAGC TTGGTTTTTG GCAATTTCCA ACTTTTGTGT ATGGTAAAAA 17820 

TGGTGAAGTT CCTGTTGTTA GGACTACATT TTACAGTAAA AGTACTGGAT ACAAAGAGTC 17880 

GCTTGATACA TTAATTCATA CAGATAAATT ACAATGGAAC GGTGAAAATG GGTCTAAAAA 17940 

TTTGAATACA ATGCCACAAC TTGTTGGTGC AGCTATTACT TATTTTAAAA GGTATGCTTT 18000 

AGTTGCGTAT CTTGACATAA AAAGTGAATT TGATACTGAT GCAGCACCTA TTTACAATAA 18060 

5'CACGAAAAC GAAAATTCTA TGCCTAGCAA GCAAGTTAGT GTTAATCAAA AACAAGAACA 18120 

AAAAAAGGAC ATAAATCAAG AAAAAAATCA ACTAAACAnC TTTAATAAAA ACTTrAAATC 18180 

TGGCAAGGCT TATTGCTATG AAATTTTTAG AGACGCACTG TTTAATATAA AAAATTGGGT 18240 
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AAATGAAGGT GAAGAAAAAA 
TGATGATGCT TTAGArGATC 
GGTAAATATT yTAAAAAAAT 
TAAAGTATTT ATGTCTGATA 
CATGTTAAAA AAA6AAAGAC 
CCAAATAGGG GGCTGTTAGA 
GCAAAATTAT CTATATCACC 
TTTTGtTGTT CTGCTTGATC 
GCTGATTTTA TTTTATCATC 
AAAGCX3GGTT TTAACCAGTC 
AGTTCTTCTT TAGATTTTGG 
CyCCGkCTTT TTGTTTGTTG 
CCGTTTAGCA TTAGTAAAAA 
TTTTTTATTA TTAATATTCA 
TTATTTGAAT TGATATGTTT 
AGCCCkGCTA TCATTGTkAT 
TCTGAAAGAG ACATTAAATT 
ACACTATCTA TTTTGGCATT 
GTTTTAACAC TATCAATCTT 
ACATTATCTA TCTTGATATC 
TCAATTTTAG TGTTAAGTTC 
TTTATATCAA ATTGTTTTTC 
TATCTTTTAG ATAAATCTTG 
TATATTTGTT CTTGAGTTAC 
CTTATrGTCA TATTATACAC 
rTAGAATTTC TTGCAAGAAA 
TATAGACTTT TTCCGCTATT 
TATGTyTTAC nGCAGTTATG 
ATTCTGGATA ATTTGGrTCA 
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ATAATATAAA 
TTTTTrAAAA 
ATTTCAATAA 
ATCGGGAyGT 
AATTTAATTA 
TTATTAGCCA 
ATTTTTAAAG 
ACCATTACAA 
ATCATTTTCT 
AAGATGTGTT 
TTTTTCTTGT 
GGCATTGTTT 
TAAACAAAAT 
CTTAACTAAG 
TAAGTGAGGT 
AGACATTGCT 
CTTTTCAACA 
TAAATTCTTT 
AGTATCTAAA 
-TAAATTAGAT. 
ATTTTTGACA 
TAAATTTTCT 
TGCTATTAGT 
ACTTGCAATA 
TATTTTAGAT 
AACCTTTTTG 
GGTTTTGTTT 
GAGTGTTCGT 
TTAACTTTrA 



842 
TGCTCTTATT 
GAATGCTGAG 
AACyAATAGA 
TTATAAAACA 
TATATTTGCA 
CCATTATTGC 
AATTCTGTAA 
CTATCAAGTT 
AAGAATTTGT 
TTTTGATCGT 
GTTGTTTCTT 
TTTAAAGTGT 
AATATGTTGA 
TATTAATACT 
rGTAGCTATT 
CCCATAATTC 
TTGTCTATTT 
TCTACAGTAT 
TTAGATATGT 
. ATATCTTTTT 
CCATCTATTT 
AAATCTCTAT 
TGTTCCATrC 
TTTGTTGACA 
TAATTGGCTT 
TAATTTACAT 
TTTTAATGTA 
CTTTTAGTGT 
CTTTTGTTTT 



CGGGCATTAT 
CTTAAGAGTA 
TTTGATGATC 
AAAGTATTAA 
GTGTAGCAAT 
AGTTACTAAC 
CCACAGTTTT 
GAGTTTTTAT 
CAAATTCTCC 
CAGATAGCTT 
TTTGGGTTAA 
CATTATCATT 
TGATTTTCAT 
AAATATTGGA 
TrGAAATrAA 
CCAATACCCA 
TGGCATTTAA 
CAATCTTAGT 
CTTTTTGCAA 
GTAAATTTTT 
TAGAAAyAAG 
ATGTTAGCTC 
CCAGTCTAAT 
CTGTTTCCAT 
TAGAGATTTT 
TTTTAACTGG 
CTCTAAATAT 
TGATAArTCT 
AGCTAAAAAT 



GTACTGATAA 
TAGAATATTG 
TAAATAAGCT 
AATTCTTTTG 
ATTAAAGCCC 
CGCTCCAGTT 
GAAAGTGGTT 
ATGATCAAGT 
AGCACCAGTT 
TTCTCTAAGT 
ATCACGyTTT 
AGAATTACAG 
TGTTACTCCT 
TAAACAATTA 
AGCAAATATT 
TTTAAGCATT 
ATTCTTTTCA 
ATTAAGTTCG 
ATTCTTTTCT 
TTCTACATTA 
ATTATCAAAT 
ATTGTGATAA 
AAATTCTTTA 
AAAATTTTCC 
TATATGTAAA 
GAATATTTAT 
ATGTTGATAT 
GGATAAGGAT 
GTTACTAGGT 



18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
199^20 
19980 



wo 98/58943 

ACATAACATA 
TTGGCGGTTT 
TTAGyAGACA 
TTCATGATTT 
GAGATAGCCT 
TTAGTTGACT 
TCTATTACTT 
ATGTTAGTTA 
TGTTCTTTCC 
GAGATTTTTT 
AGCGAGTGCy 
ATAGATTAAT 
TTCATCAAAT 
TCCAAGCTCA 
TTTGCCATTA 
TAGTAAAGGC 
CGCTATAAGT 
TTTTTAATCC 
TTTTTGCTAA 
TCTTTTTTGG 
CGCAATTTCA 
TTTCTGCATC 
ATTATCGTAA 
TATCGCGTTA 
AGCAArATTT 
TGATGAAGGC 
TGTAAGGCGT 
TAATTTGTCC 
TTCGGCAATT 
TTTGTCTTTA 



CTCTGAAAGT^TGTGTTTCAT 
TGGCTCTTCT GGTAGGTTGG 
ATGCAATCTT TTAAGCATTT 
TGTTACGTGT TGCTTTAAGT 
CTATTATCTC AATGTTGTAT 
CAGCTGTTTC CATAGATTTT 
TACTA/UU^GT ATTAATGTAA 
AGCTGGATAG TAAATTAAGT 
TTATAGATAG GTTTTCCTTC 
TCATCAGAAT TAACTAAGTC 
ktATTTATTG CTGGGGTTAA 
TTATAATGAG AATACAGCTC 
TCATCTTCAA ATTTAGAAT^ 
ACATTATCTT TGGATAATTT 
CCATTACCAT TCTTAAAAAT 
TTGAGAAGAA TTAATACTCC 
TTAATTTCGT TTAAATTGAT 
TTCATTTTAA TTTTTTATTT 
AAAGTTTACA GTTTTAAAAG 
ACATACCATC CTTTATAAAT 
TAAACCCTAT TGTATGTAGT 
CTATTATCAT TGATTTTTAC 
CTTTTAGAAA AAATAAGAGT 
TTCTCATAGT CAGAAGGATA 
GATGGTACTC CAAGTATATG 
ATTATCAAAA GATsATCACT 
GATTTAATTT TACTAAAAAG 
GTTATTTTAG CATAAATTTT 
GTAGACTTAA TTATCTGCTT 
GAAGCATCTA AAAAGTTTTT 



.Gl^T' 
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ATTTAGCTAA AGATTTTAG^^TTGGAATAA 20040 

CAATAGTGGT GCAACATAGT ArCAAArCAA 20100 

TCACCTCTTT TAAGTATTTT GATATATTCT 20160 

GAAGTGATAA TTCTTTTGCT TTTrTCAGTA 20220 

TTTAAAATGT CTTGTATTTC TTCAAATATT 20280 

AGTGTGCTTA TATATGTTTT GTAGAAAAAA 20340 

TTATGATCTA TGTTTGTATC AGTTTTAGCT 20400 

CCTAAACCAA TAGTGTTATT TTGCATTATT 20460 

CTGATTGAAT TTCAGATCAT TAGATATTTT 20520 

AATGCATTGA TTGATTTTTT CATTTAATGG 20580 

TGCACTCTCA AGTCTTTCCA TATTTGCTGT 20640 

ATAAACCAAA AAGAATCCTT TATGTGCAAT 20700 

TATATCAATA AGGGTTGATA AAGACGTAAG 20760 

CATAAGTTAA TCTCTTTTTT TAATGTGATT 20820 

CTTGCCTATT ACAATAGTCA ATATGTCTTT 20880 

TAAAACCAGC ACTGTTACAA AAATCATTAC 20940 

AAGAAGTTCG GTTAATTTAA TAGTATCCAT 21000 

TTATACGTAT ATTATATACC AAAATCATAA 21060 

ATCTGGGACT GGATCTCCAT ACAAGGAGGC 21120 

GGGAATTCTG GTGAATAGTC CGCGGGGGCC 21180 

TTCATCAGAA TACTGAAGTT TTAATGATTT 21240 

TTGAATTTCA ATATCAAGAT AAACGGGAGA 21300 
TACATCATCA TTGTCTTCCA TATTAATArA " 21360 

AAGTGTAGTA CTTCTAGTTA TGCTGCCATA 21420 

TTTAGGAACG GGTGTTTTTT GAATAGTATC 21480 

TCTAGATAAA GTGGCTGATG ATATGCTATC 21540 

GTTAGAAATA TTA6TAGAAT CGTTGTTAAT 21600 

TTCTACAAAA TCTTTATCAG CTGCAAGTTC 21660 

AAAATAGTCT AATCCyTCTC CTTTAAATAT 21720 

AAAGGTGATA GCATTACTGC TTGCAGCTCC 21780 
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ATCATCAAGC 
TTGAACCGTT 
TTAGTTGTTA 
AATAGGAATA 
GTTrAATACT 
CTTTTTTAGT 
TATTACCCCT 
CACATTTAAA 
AGCAAAAATA 
AT^GATAGAT 
TACATTAATG 
ATATTCTGTT 
TTTCATATTT 
CATTGTGTCA 
TGTAATACTC 
TTTAACTTCA 
ATAGTTATTT 
GAGrTAGTTT 
TAGyGATATT 
.^TCCCTCAAGT. 
AAATTCAGGA 
ATATATGTTG 
AAGTAAAGCm 
AGCAGCCCAA 
TATTTCTTCT 
ATCATCAATA 
CTTAATTGTA 
TCCATATTCA 
GTAGTTGAAA 
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AGTAAAAGAT 
TCTTCTTCAT 
AAAGTTATAA 
ATTCTCTTAA 
AAAGCyTTTT 
CGTTTTCCTT 
TTTAAAGAGA 
AAGGTCTTGA 
ACACTATTAA 
AAAACTTGAG 
GATATGAAGT 
TCTGTACGTA 
GTTAACTATC 
TCATTAATGG 
TCAGTGTCTG 
TTAACTGGAG 
GAAATAATCC 
TTAAGGTCAA 
TTATAGGATT 
.AAAGTmCCAC 
CTATTAATAT 
GCTTTACCAG 
GTGCGAACCG 
TAAGTrCCAC 
TCAATTAATG 
TTAATmCCAT 
CGTTTTAAAA 
AAACATCGCC 
TATTTATTAA 



CAGTATCGTT 
CAATTAGTAA 
TATTGTTACC 
TAAAAGCATA 
TAGATGCAGC 
TCTTAGTGCT 
TATCAATAAC 
AAATCAGTCT 
TATTGCTTGT 
ATATCCATAT 
TGGAATTAAG 
TAAATTTATG 
CAATATCAAT 
CAATATCTTG 
TATCTTTAAT 
CAAAAAAGTC 
TAGAATAwAT 
GTTTATACTT 
TmCGTTGTCC 
TAGGAGTTGT 
TAGATTTACT 
CTGCACTTTT 
CrCTGTAAGT 
CcGGTTTCAT 
CTAAAGAAGA 
AATTTACACG 
TGCCAAAATC 
tGAGAAAAAA 
ATCTAAGTTA 



844 
AACGGTCGTA 
TTTTTCTTGA 
ATCTGTATTA 
AATT6AATGA 
rTATCCCGGC 
AGGCGAAATA 
CCCAGCTTCA 
AAATGACTCG 
AATACTTTGT 
TGCAATATAT 
GGACTTAAGT 
AATTTCGGTG 
AAGCAATCTA 
ATTTTTTTTA 
ACAAGCACTT 
TTGATATTCA 
rTCCCTAATT 
TACTTTCATr 
AGTTGAATTG 
TAGATATAAT 
AkyGTCTAGT 
AATATTAGTr 
TGTGCTTTTA 
TTTAGAAAAA 
CGCAATAATG 
CAAATATTCT 
AGAATCAAAA 
AAGGATATrT 
AGyTCTTTAG 



ACCTTATTTA 
TCATCAGCCA 
TTAATTTTGA 
TCATAGCCCT 
TTCTTTTCTG 
AATGTAGTAA 
GGAGTAGTAA 
TCAGTGCCAA 
AAAGTTTGAG 
CTTGATTTTA 
TCATTAAGCA 
TTTTTGAAAA 
TCTGTCATAT 
AAATCGCTAT 
ATTTCCATAA 
AAGCTrATTC 
TGAGAGTCwA 
TAAACATATT 
AGrCCATCAA 
GTTTCCCAAA. 
AAAGTTTCCT 
TACTCAAyCC 
GAAGAAATGT 
AAGAGATTAA 
TTATAAATT6 
CTTTTCGATC 
ACTATrCTCA 
GTGCTTTGTT 
ATATTTCrTG 



AATCTTTTAT 
TAAAACCTCC 
GAACTCTACC 
TAGGAAGTGA 
TAAGAATTAT 
AGTTTGTTTT 
CTTCAATGTC 
TATGACGTAA 
TTTTTGCATA 
TATTTTCTAT 
ATGCTTGTGC 
GATTGGGTAT 
TGAAAAGTAG 
CACCAATTTT 
ACTTAATTCC 
CCATATCAGA 
TrTTTAAGTA 
TTCTTTTCCC 
TTTCkATGTC 
GTTTTGCTTT 
TTArAATTAG 
CATCAAGATT 
GTTCTTCAAT 
GCTCATTAAT 
AGCTTTGrTT 
TTACAATATC 
TAAATTAAAC 
GTCTTGTATA 
AAAATAATTT 



21840 
21900 
21960 

. 22020 
22080 
22140 
22200 
22260 
22320 
22380 
22440 
22500 
22560 
22620 
22680 
22740 
22800 
22860 
22920 

..22980 
23040 
23100 
23160 
23220 
23280 
23340 
23400 
23460 
23520 
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TTTACAGCGT GAAGATTGT'^JaTTTTTAAC 
CAATGAGGAG CATAGCTTAA ACTACCCCTT 
TTTTGTTCwT CAATTCCATC AACAAGTGAT 
TTGCCTAATC TTAAATCCAT ACTAkTAATT 
AACTrTTAAT ATCAkAATTA ATTTTAGTGG 
CTGGGCCTCC TTGTGyGGkT rCkAyTTTTA 
GAATTGTTTT TAAGCTAGTT GTTTGGTTAG 
TAACAGTATC AGAGATTAGA TTTAAAGTCT 
GATGTTTGTC AAAGTGAATA TCGTTATTTT 
GTAAAACGyw ATCACCTTTT GATAGTTCTA 
TTTCTAAATC TTCAAATTCG GGTATTGTAA 
CCTTTACAGT GCCAATTTTA ATTATAAAAA 
CTTGAGCCAA TGCCTGGCCA TAAAGGCGTT 
TCATTCTAAT TCTAGTCCCC TTTATTTTTT 
TAATATTAAT GAACACTCTC CTGTATTGCT 
TTTTATCATT TTCCCTAGTC CATCAATAAA 
TGTGAAAAAT GTTTTTGCGT TCCAAAATAT 
AATTTCTTGT TGTGGTATAA ATTCAAGCCC 
TTCCCCCTTT TTTATATAAT TAGTAAATAT 
ACCAATATCG GCTATTACGT TATGAACATA 
TGGTGTTGTG GCATAAATAT CTTTGTCAAT 
AAGGATATTG CGATTGGGAA ATACAGATTC 
GTTTTTGCGT TCTTTGCCTG CCAAyTyrCG 
AACATCAAGA TCTACACTAA AATCCCCACC 
AGTTCCTGCC ATTATGAAAT CAAAATTTTT 
TACTATATCT CCAAATTTAA TGTCGTCGGT 
TTTTGCTTGT TTGGAACTTA TAGTATGAAT 
AATATGAATT CCATCTTGTG TATTGATGAT 
TCCATCAGGT GATTTTTTTG ATGTATCTAC 
TAGTAACAGC ATTTTTTATC CTTTATATTT 
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AGTTTTAAAA GCAAGAAATW^OTCCArTCCC 23580 

AAGGTTTTTA AAAATATCAA AAATCTTTGT 23640 

AAATCGTTAT TAAATACCAA TTCAAAATTA 23700 

ATACCATAwT TAGCAAAAAT TACTTrAACA 23760 

TTGCTATTTT TAGGCTGACT GGTTCAATTr 23 820 

TACCCTCAAT AGCACTTACA ATATTTTTGA 23880 

CTATTTCAAT gTTATTGTTT GCTTTAATTT 23940 

TTGGGCTAAT TGCACTAAGT ATATAAAAAT 24000 

TATCAAAAAT ATTAAyGCTT GATTGAAGyA 24060 

AACTGATATT AGAGATATTT TTTGTGTGAA 24120 

CAATAGCTTC TTGAGTTTGA TGTTTAAACT 24180 

TGTTTGAATA AATCCAATTT TTAAGGTCTT 24240 

GATTCATTCT GTAAATTTCA TAGTCTTCAT 24300 

ACGTTTTGTA TTAGAATCAT CTTCTAACTT 24360 

AAGCCTTGCA CTTGTTTCTT TTATAGTGGT 24420 

TGAGACTTTA TCTCCAACAT TTAACTTATG 24480 

AAGATTTTTT TTGAGTGTTG TGCCCAAAGT 24540 

ATAGTCTTCT AATGCCTCGT AGTGGACATT 24600 

CAGATAGCAT TCATATCCCC GTAAACCAGT 24660 

TGTTCCTTTw ATTTTGTCAA TAAACTCTTT 24720 

AATTTTAAGA CAATCTTTTT CATCCATATT 24780 

TATTGCCTCC TkCACCGTTT TGCCTTTAAA 24840 

ATTGAAGAAr TTGCTTTTAG TTAATAAACG 24900 

CGGATAATCA GTGCTCATAG GAGGTCCTAA 24960 

TTCATGAGCA AATTTCTTAT AATATATTTT 25020 

GAAGTCTAAG GGAAGATTCC AAAGTACGAC 25080 

ATTTGAATAC ACGTTGGATA TkGAAATATC 25140 

AATTTTAGGA ATTTCTTCGG CGAAAGGAAT 25200, 

ATTGTAGAAC TCAATTTTAA AATCATATTG 25260 

TTCyAATGCa AATGTTTTTA CTATTTCTAT 25320 
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TGATArACTA 
TACAGCTAAT 
TATTCTATTG 
AAAAACAGTC 
GTTTAATGAk 
ATCATAATAA 
TTCATTTTTT 
TCTAGGAAAT 
ATCTCTTATT 
GTTAATATCC 
GATTTTGAAy 
CAGGTAGCAT 
CATTAATTAT 
TCTTATTAAT 
GCTCAGCTGA 
CGAAAGATTT 
CTTGTGCCCC 
ACTTCTTTAA 
TTACTGCATC 
CGTTTTTCAA 
TTGCTTGATT 
TAATCTTTAA 
GTGTTCTTTT 
CTCCAACTTT 
TGGCAACAAG 
TTGCAAGTTC 
AAGCCTCTTT 
TAAGTCTATA 
CTTTTTTCTT 



ACCTCAACTT 
TCTTTAAGGC 
GCTAGTTGTT 
ATTTTrAGTA 
ATATGTtCAC 
TTGATAACTG 
GGTTTTATAA 
AACACTAAAA 
ATTyGAGwAA 
ATAAGTAATT 
TTCTTCTTGT 
CGATTTTAAT 
GGGATTAATA 
GAGGTCAAGT 
GGCCAAATTA 
AAAATCCTCG 
GCTTTGCCAG 
TAGATCAAAA 
TTCGCTGCTC 
ATTAGTTTCA 
TAAGAATTCT 
AAGACCCTCT 
TGTTTTGGTG 
ACTCATAGCG 
TCCTTTTCCT 
TTTATACTCA 
TCTAGCTTTC 
TTTCTCAACA 
GTCCGACAAA 



CGTCAATGAA 
CAAAAGTTGG 
CTTTTACAAG 
AAGAAAGCAT 
CAGTCATTAC 
GTCTTTTAGA 
AAAACAATTG 
AATTATCTGC 
TyTCCTGGGG 
ACCTTTtAcc 
AGTTTTTTTA 
TTTGCAAAGA 
ATGTGTGTTT 
AATGGGTCCA 
CTTTGAATAC 
AACATTTCCA 
GCCATTTTGG 
AGCTCACTTC 
ATAGCACCAC 
.TTTAACATAT 
TCTTTTTCTA 
TTCTCTTTTG 
TCTTCTTCAA 
TTGCTAATGA 
TGAGAGGCCG 
AGACGCCTTT 
TCAAACCCCA 
CGCTCTCTTA 
TTATTTTTTA 
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AGGAGTATCT TTAAACGAAA GACTTGTAAT 25380 

ACTATATATA CTAAAA6GGA CTTGTGCTTG 25440 

ATGmGCGTCA AArCGTAGCA TAGTATTGCC 25500 

ATCCTTATAT AAGGATGTTA GTATTCCACC 25560 

CGGATTGTAG CTHACATATT CCGCTTTTCT 25620 

ACAACTAGTA TTrTAAGTGC GTGTTATGAG 25680 

AGGAAyATAT CCAAAACCTT TTAGATCCAT 25740 

TCCrAAAAGr GCAAATATTT GGGTTATTAC 25800 

TAACATTGTT TTATTGTTAG TATTTTTATT 25860 

AAAATTATGG wGTGyTGTTA GCATTGTCTT 25920 

GAGCCGCACC CTCATCTCCG CCCATCCATC 25980 

AATAATTAAG ATTAAAAATA CTTTTAATGC 26040 

CAAACGCAAA GTCTTTAAAG TAATTAGTTA 2 6100 

AGACAGTAGT GGTTAAGTTT TGAAGAGTTT 26160 

TCTCAGCATT ATTGACTTTT TTTGTAAGGC 26220 

TCATCTTGGT AATTCTAGAC TCTAGATCTA 26280 

CATCTTCTAT ATATTTGTCT CCAACACCTG 26340 

CATCACCCCC AAGAACACTA TTAACAGCCT 26400 

TGGATTTAAG CATAGCTGCA AATTCTACTG 26460 

CTAAATCCCT TAAAGTACCC TTAAAGACAC 26520 

GGTCGCGCTC AAATCCCTTC ATTCCGCCAA 26580 

GATCACCATA AAACGCTTTA TTGAGAAGTT 26640 

CCGCTTTTTT AGCAAAACCT AAAAGGCCTC 26700 

TATTCCCTAG GGCACTACCT ATAGCAATTT 26760 

CTAACATTTT ACTTTTTGCT TTTGATTCTT 26820 

TGTCTCTATC AGACATTAAA GATCTTCTGA 26880 

TGCCCTGTTT TATAAGTTTT TTAGTTTGTG 26940 

AGCTTTCAAA TTTAGATTGT CTACTAAdTT 270O0 

CAATATCTTT AGTGCTACCC AAACTAGATT 27060 



wo 98/58943 



847 
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TTTTAGGTTT AAGATATPTi^TCCATTTTAG AAATATCTTG TTCAATGGC^^'tTTTTGTTG 27120 

CAGCATGATC AAGAATACCT TTAAATTTAA TGGTGAATTT GTCGCTCACT AAGTCCTCAC 27180 

TTGCTTAAAA TTAATTCATA CAATTCTTTT TCTAATTTAA TCTCAGCAAG TCTATTGACT 27240 

TCTAAAAGCT CGTCATAAGG CAATTTTTTA ACCGAGTitiGT ATGAGCAAAT ATTCATAATT 27300 

ACTGGaAAAt AGTATTTATC GTTCTTAATC TCGTCAAGCA AGTTAAAATA TTTTTTTCTA 27360 

GTCTCATCAA GACTTGCAAT AGCTTTATCA ATATCTCTAT TTCTTTTGyT CATTTAGCAA 27420 

CCAGCTCATT GGAATTTGAT GTAmTTGATG AAAGyGAAGT GGCTACTTTT TCATAATCAA 27480 

AATTTTCATT AATATAGTCA AAAGCAACAA AATCACCAAC ATTATTTTCA TACTCACTCA 27540 

AATATACTAA AGCGGGCTTT TTTAGATCAT TGTCTAAATG AAAAGTATTA AATTGTGCAG 27 600 

TGTAAATTAT TGCAACAAGA TAGTCCTTAT AATAAGAAAT AAATTCTCTA TTTTGATCCA 27660 

AAATCACATA GAATTCGTCT AAAAATTTTG GACTTATCAT TAAGCTTGTG ATTTCTCTTA 27720 

AGTATTTAAC CTCATTAAGC TTTAAAACAG CGTCACTTTG ATTAAATCCT AGCACTTTAT 27780 

CCCATTCATA GACGGGAAGT ACTCTCAGCG GATATTCATA AGTTTTATTT TTAGTTAAAA 27840 

TTTTCATTTT ATATCTCATT ATCATAATAA GAltlTCTCCTT TTAAGwGTTG TTTGGTTTAG 27900 

ATTTTTGGCA ATTAATAGCC CTAATTTCAA AAGATACTTT TTCGGCCTCA GCAGAATAAC 27960 

TTCTTGAAGG CTCTTCAGTA AA/^TTGCAT AGTTAGAAAT AATTTTGGTA GCAATTCTAT 28020 

CATTGAATGC TAAATCAAGC ATTTTATCCT CTTTTCTCAC ATCCATGTTG TAAAACTGTT 2 8080 

CATCAGAAAG TTCAGTTAAC AAAATGTAGT CATGACTACC TAGTGTCACT TCAATGTTGA 28140 

AAACATAAGT TATTGTTTTG GGATCTCTTA AGCTTATTAC AGGCATACCT TTATCTTCAC 28200 

TACTAATCAC TGCTCTTGTT GTAGGTTCGC TTGTAAGCTC TAGCTTGCCA CTATGTAACT 28260 

GCGTACCACC AATTGAAAAA TAAACTTCTC TTAAATCATA AAATTGCATT TTTAGCCCCC 28320 

CTTTTAAGCA CTTAAGCTGT TTTGATAATC AACTATATCT TGAGTAGTAA TTACTAAAGC 28380 

AACAGCATTA ATGCTAAAGT TATAAGTAA.T ATTCACGCTA AGTTCTAATT TAAGTTGTGG 28440 

CGTAGGAGAA AGAGTAAGCC TTAAATTTTT ATACTCTATT ATCAGTCCTC TATCCACAAA 28500 

CCTTTTCAGT AAACATTCAA TTGCTGAAGT ATATGCATTG TCTCTAGCTC CACTAAGTTG 2 8560 

TAGTGCAGAT AATTTGCTAT TTTGCCTATT GTTTTTGTTC CAAATTCTAA TAAGCTCAAT 28620 

AATCGCTTCr TTTTTTATAT AGTGGTATGT AAATTGTTCG TCTATTGCAC CTCCAGCTAG 28680 

GTCAACACCT TCTTTAAAkG CrGGTACACC ATCAAGCCCA GTTTCA'^AA GAAGTGAATA 28740 

AAAGTTGATT TTTGCAGTTC kCAACTTTCC AATTACAGTA TCATCAACAA GTGGTGTAGC 28800 

AGCCAGCGGC ATGCCATAAG GATTTACAGC ATGAAAAATA CTAGCTTGAT GkArATATTG 28860 
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ACTTATAAAT 


TTrAGGTGTA 


AATTGTCTTT 


ATTrTTrCTG 


TAAACAGCAA 


TATTTCTTTC 


28920 


TTTTTCAGTA 


TTGCCTTTAT 


CTTTAAATAG 


TTCTTTTATT 


TCTTGTTCTT 


TAGTCGAGAA 


28980 


TACAAAAAAA 


rTTGAAGGyn 


TTTTrAAyTT 


ATyATArTCA 


TCTTTrTAAA 


TyTTAAGTCC 


29040 


ATCATCkGAm kyATCnCCCT CAGTrTTAAT AAGTACAACA AAAGTGTGTC 


TATGTACTTT 


29100 


AAGATAwTTT 


TTTArCTCTT 


CrGGyTTATC 


CTTATAAATr 


AAAAGATCGG 


CTGATTTTAA 


29160 


yGATTCTTCr 


CTTGAATTGA 


AAAAATTyGA CATTGCAGTT 


TTAAGCAGTG 


TTTTTTCTTT 


29220 


TCCAAACTGA 


TCTTsTCCAT 


TyCCATTmTC 


TTTTTCTAAA 


GTTTCAATTT 


GTTTTTCATA 


29280 


rTTATTAACG GTTAAATTCA ATATTTTATA GyTAGCAGCA TCTTTATTAA 


CTTTGATTTT 


29340 


AGCTGTTTTG 


TAAACCAAAA 


GTGGATTATA 


ATAATTrGGC 


CTACTAGCTT 


GAATTCTAGA 


29400 


GTCAAGCAAA 


CTTACACTAA 


TTGTATCTTG 


CGGCAATTTy 


GTATTCCTCC 


TTTAAAATTT 


29460 


CAATTGCTTT 


TACACTAGCA 


TTAAATGCTA 


TAGATGCACT 


GTATGCATGG 


TTGCTATATT 


29520 


TTGTGCCTAA 


ATTAATCAGT 


CCAACTGTTT 


GCATATTAGA 


TGTTGGGTAA 


ATGTArAAGT 


29580 


TAATTTTATT 


AATATAkTCG 


GGTTGTAGAC 


TGGGCAAAkT 


ATACTTATGA 


GCTTTATTGT 


29640 


GTAGAAAGTC 


ACTAAGCATA 


CTATAAAGCA 


TT/^CATGCG 


TGAATTAGCG 


TCAAAGTCTT 


29700 


TGGCGTTTAA 


CACTATTGCA 


ATAATATATA 


TTTGAAAATT 


TATACTAAAT 


TCCAAAGCAT 


29760 


TTTCATAAAA 


TACACCGGCT 


CTAkAATTAT 


GATCAAATAG 


ATTTTCTGTA 


CCATCAAATT 


29820 


TCAATGCTAT 


TATATTTGAG 


CTAGCAGCTG 


TGATTTTTGA 


AAGATATGGA 


TGATTGTAGG 


29880 


TATTTATGAT 


ATCGCACTCA 


AAATTATTTT 


CAGTTGCATA 


yGCCTTAAAC 


CCTTTAAATA 


29940 


TTTGrGTTAA 


ATGATTTAAT 


ACCATATCTA 


AAGTGAAAAT 


CATTCAAGTG 


TTACCTTATA 


30000 


. AGTAATCTCT. 


GATAACATTT. 


-TGGCTGTATC 


AACAAGTGGA 


ATTGCTGCAG 


TGTTACTACG 


30060 


CCTTTTAAAC 


TTACTTTTGA 


TTGTATTAGC 


CTTTAAGGCT 


GGAGTGACTT 


GTGCTGATAG 


30120 


TAGATAATTT 


TCATAGTAyC 


TTATAAAAGC 


TTGTCCAATA 


GCCTCCATTC 


CCGATTTAGG 


30180 


GTCAAGATTA 


AACTTAGAAT 


TTATATAGCT 


ATTATTGATA 


TATTCTCTAA 


ACTCAGAACT 


30240 


ACTAGCAATT 


TTGGTTAAAT 


GTTTTCTTGC 


TGGTAAATTG 


CTACTCCCTT 


TTTCATGCAT 


30300 


TTTAGCAATA 


CCTGCACGAC 


CACCAAACCA 


CCCAATTTCC 


AATTCCATTT 


TAAATTCTAG 


30360 


TTTGTCCATA 


TAAATTCCTT 


TAAAACCAAA 


GTAAAATATC CkATTGAAGA GTCAATACTA 


30420 


AATATTTCAA 


AGTAAACTAA 


ATCTGCAATT 


GATATTCGGT 


CTTTTrGTTC 


ATAGTTAAGG 


30480 


TCTTGATATG 


TGTAAAGTTT 


GGAATATCCT TGAATAT^AG ACATATCAGA ATCATAAAGA 


3054O 


ATTGCAAGTT 


CTTGTGGCTT 


TATGTCAATA 


ATAACTCCTG 


CrAATTCArT 


GTACTTAkTT 


30600 
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TTATCAAATA 
AACTTTAAGG 
CTTTTyCTAA 
TTAGTTTTTC 
CCTCGCCrCC 
ATTTCTCTTT 
GrCArCCCAT 
CAATACCrCG 
TGCTTAATGC 
CCAAAAGTTC 
TTTACCTTAT 
AGTArCCCTC 
ACTTGTTCAT 
TTTAATGGGT 
TCTCTATTAT 
CTTGCTGCAC 
ACTATTACCA 
TCAATTTTTT 
ACTTGATtga 
TTTTCCATCT 
AATCTCGCTA 
ACCAAGATAT 
GTACTGTAAT 
AGTATTAACy 
AGTTCTTTGG 
ATACATTATA 
TTCATCAAAT 
ATTTCCAAAT 
CAACGCTATy 
ACCGTCTTTA 
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CTCTCTGATA"T&3AAGAATCA TTTTCAAGCT 
GTTTAGGATC CTTAAATACG TTGATCATGC 
CACCATTCAT TAGACAACCC CCACACAAGA 
TAAAAATGCA TCAAGTTGTG AACAAAAATT 
TTCTTCGCCT CCACTGCTAC TAGGATAATA 
TTTGATCCTA TCAAATTCAA ATTCTCGAAC 
ATGGTAaAAG gTAAGTAAAA ATATTTGTTC 
TGTTACTAGA ATAGCTTGAA GTAAAGATAA 
AAGTTTGTCT ATTCCTAGTA ACAATAACAC 
TTCTTCAGCC TCAAGTTGTG TTTGTAAGTT 
GTTTTTAACT TTGTTTAATA TGTACTTGCA 
CTAAAACAAA ATCAATGTAT GAATGAGCAA 
TTGGTGTAGG TAACATATAC TTGCTAGGTT 
AAATAAGTAT TTGATGTTTT AGCAAGTTTG 
TAATAGCCTT GATAGTTTGA ATCAAAACAT 
CCTGTGCTGC TGCGTATGGC TTTACGAGTT 
TCATAGGTGT AGAAAATTCG TCTCCTAGCT 
CAAATATTTT ATCCATTTTG TCCTTATTAG 
tGTGGCATAT TAAGAAGTCC ATACATATTG 
TTTTGAATTG AAACAGTGCC TGTTAGTACA 
CTTGCAAGCT TATAGGCTTG AGAGAAAGGA 
GAGTCTGAAG TGTAAAATTT TTCAGACGCC 
TTTAAGTAAT TAAGTCTTAC CACTTCAGAA 
TCATTAGCAA TCGTTGTAGG ATTAGCATTT 
TAGCCCATCT GAAGATCAAC ATCTTCAATT 
GGATCTTTAA CTTCCCCTAT AATATTAGCC 
AATTCCATAT TAAATCCTCC CAAATATCAT 
ACTGCTACTT TTATTAAAwA AACATCGTTA 
GCATTAATAG TTGCCTTATT TGGTGGTGCT 
TTAAAAACAA GTTTGTCTTT TACTTTAAGC 



stTTcc 
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TTACAACAGT"TK:CTTTATAA 3 0660 

GAAATGACAT ATCAGAAAGT 30720 

TGGCGTTGAA GTTTGTCTTT 30780 

CTTGTTTGAG CCACAACyCC 30840 

ATCAAGTTCA AGTTCATTGA 30900, 

AACTCCCTGT TTTCTTAATT 30960 

ATAyGTmAGT GAACTrGCAT 31020 

ATGAAGTAGA AAATTTTGyC 31080 

TTCaGAATrA AGTTTTGTTA 31140 

TTTTTGTTCG CTCACTTCGA 31200 

AAATAGTTTT TCTAGTAGCA 31260 

TATCAGTTGA ATCTTTATCC 31320 

TAAACTTAAT AAGCTCTGGG 313 80 

AAGTTTCAAT GTAGACATCT 31440 

CCTCCCATTT TTCGCAGCTA 31500 

TGAGmGAAGT TGTAGGGTCA 31560 

CTAACTTTGA AAGTCCCGCC 31620 

CACTTTCAAC CTCTTCTTTT 31680 

GGAAGTAGAC GTTTTTGATT 31740 

AAGTGATTAA TAAGTTTAAT 31800 

AGTAArTTGT TATTAATGTC 318 60 

TGCTTTAAGT GCCTAAATTT 31920 

CTAAATCCAA TAGTTGAAAT 31980 

AAAAACGCAT CCCACTTTAC 32040 

TGATCAGGCG AAAACCATTT 32100 

ACAGCTTTTG CATAATAATT 32160 

TAATTTTTAC TTACAGCTTT 32220 

CTAATTTGTT TTGCATCAGA 32280 

CCAGTCACCT TTTCAAGAGC 32340 

GTAGAATCTT TTGCTACTAA 32400 
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ATAACCCTCA AAATTATTTG TAATyGGAAC AATAGTGGCT GTTTTGCTAA ACTCATCTAT 324.60 

ATCAATiSCAT ATTCCGTATA AATCATCTTC ACCACCAGCC TCAACGTGGG GTTCATAGTG 32520 

AATTTGATcA GCTTTTTCCT CTTGAATAAC TCTTTTTACC CCACGCTTrT ATGGATAyCC 32580 

AGAAAATGGA TGATTTTCTA ATTTGTCAAA TTTGCTGGTT CTAGTGCCTC CAGAGGCAAA 32640 

AAATTGTATG TTTTTATCTC TAAACTCTAC AGAATTGCTA AGCAAACCAG CGTCATrCTG 32700. 

GGGATTTTTC ATAAACTTTT CAAGTTTACT TClcyTTmTCT TGATAATCTT TTAATAATTG 32760 

CGTTGTGTCT GCCATTTGTT TAACTCCTTT TATTGCCCAA GGCTTAACCA CCAGCTTCAG 32820 

GTGTTACTGT TTTCTCAAGG CCTCTATTGC CAAAAATTGC AACTTTTATC AAATTAATAG 32880 

AATACTCTTG TTTGGGATAT CTAGCTTGAT CTTGATGTTC ATCTTCGGGT GCAAAATTGA 32940 

TTGTAAATGA ATCAGAGAGG GCATATGCAT TAATTrCGGT TGGTGGCCCA CCACCAGCCT 33000 

TGATAATAAC CCCATTGTTA TTTATATCCA ATATTTCTCC CATTTTTATA CTCGGATTTC 33060 

TTGTAACAAG ATACCCTTCA AAGTTATTCG TAATTGGTAA TACATACGCA GTACTACTAA 33120 

ACTCACATAC ATCTACACAT ATCCCATACA TATCAGTATC AGCACCAACT TCAACATATA 33180 

TAGAGTTCTC TTTTGGAACA AGTTTAACCC CACGCTTATA TGGAAAACTA TTTGCTGGAT 33240 

CATAAAGGTA TTCTTCTATT TTGTCTGCAA AGCTTGAACA TGTAAAAGAA TAAGCATTAA 33300 

CTCGCkCATT CTTTGATTTA AAACAACCAC CCGAACTACT AAAAACCTTA TTTTCAATCG 33360 

AACTCATTGA TTTTGAATAT TTTTTAAATT TTAAAAGAAC ATCGTCAAGT TCTTTAACTG 33420 

AATCTAAATA AGGATCTTTT GCTTGTACTT CTTCAGCCTG TCTTGTTTGA CGTTTAGATC 33480 

TAGGAGCAAC TGGAATTTCT GATTCTAACC CTAATTGTGG ATTATCATCA ACATTAGGAG 33540 

.AT.TTAGCTTG CCCTTTGCCT ,TTTAAAGCCA TAATTTAATT . ACCTT,TTAAA GCTCTATTCC 33600 

CAAAAACACT AGCAAGCACT ATrGATAACT CTTCGGTTAA TTTATGTACT TTTGAAAGTG 33660 

CTATAGCATT AACAGATTTA TCATTTCCCC CATTCTTTTC AAGCTCTCCT TGTGCATTAA 33720 

AATGCAGCTT ATCACCyGGr TTyACACCAT TTgtCCATTT TTCTTAAATG TTAAATACCC 33780 

CGTGAAGTTA TTTrTAATTG GAACTACAGT TGCCATGCCA GTAAACTCAT CTATATCAGT 33840 

GCATATTCCG TACAAGTCAT CCCCACCACC AGCCTCAACT TCTAGTTCTG TTGTACyATC 33900 

TGCACTAAAA CTAAGCTTGA CTCCACGCTT GTATGGATAC CCTTTAGCAG GATAATTTTC 33960 

TATTTTrTCT TTACTACTAG TAAAAACTCC ATCCGAATTG GAGTAAATTA GATTTTTATC 34020 

TCTAAArTCT ACAGAA^^TmC TAAGCAAACC AGCATCTTGC TGAGGATTTT TCATTAATGC 3408-0 

TTTAATTTCT GCAACTTTTT TATCAAACTC TTCTTTTATT TTTGTAATAC CATCGCTCAT 34140 
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851 

HTCTT TTATGTCTTT 



TAAAAACTCC TTTAAGCAAT 
ATTCGTCTTT GCTTGTAAGT ATTACTTATC GCTTGTACAA 
ACAAAATTAG AATCAAGCAA ACTTGCTCTC TCTTCTGATT 
ACAGAGTCAA CAGAAGAAAA ATTGCTACTC GCAGTTTTTC 
GCTAAAGAAA CAAGTTGCTC TAACATCTCT CCATCGATAT 
GCAATAGCTT TAATTTGCTC AATTGGAACG AACTTGCGCA 
TGCATAATGT CTTTTAATGT GTATCCTTTT GCAAGCAACA 
CTAAGATGTG CTTTTGCAAG TGTATCAATT TCATTTATGC 
TGCTTTTyAA TACGCTCCCk CTCTTCAACT TCTGCrAGTT 

. ATACTTAAAT CTCGACTTGT CTCTTTGGAT TTACTATTTG 
TACTCTTCAA ATTCCTGCGC ACTTATAACT TTAGTATCAG 

-^TTATCTTGTG CTTGCAGGTC TTCTTTTTCT TCTTTCTCAG 
TCAAAATGAG AATAATTTCT CTTTTAAAAT CGCTArCTCC 
TTGTATAAGC TGGTTATATT f ACTGTAAAG CTCAATTAGC 
TTGyTCTTCA CTTAACATAA TCAGmGAATT AAAyTTCATA 
AAGTTTyAAr TTACAAGmGT TCTCAAyTTG TTCTTGCACA 
ATTACTCCTA TCmCCTTTAC CAyCATTTCC TAryCCTTTA 
GGTTAAGGGC TCTTTAGTAT CTGCACCAAT TTTTGCCTTA 
TAAGTAACTA AGrTCGTATT TAATAACCTC TAAACTAGCA 
CATTCCCTCA TTATTTAGAT TrCTTTTTAG CCTAGCAAGC 
AAGGTTTCTT AAATTAGAAA TATCTTTACT ATGATTGTTT 
AGAAGATAAA ATGCCACTTC CCCTATCATT ATTrCTCTGA 
TGTTGCGCTA GACAGTGCGT CTTGTAGTTG TACTAAAGAT 
(2) INFORMATION FOR SEQ ID NO: 6: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 26811 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
. ■ - * (D) TOPOLOGY: linear 



PCT/US98/12764 



. TTAGATTTTcTTtAAAATTGA 34200 

ATTCTGTGAA ATTAATAGGT 34260 

TAACAACAAT ATTGCCTCTG 34320 

TTAATTTAAT ATTCACTTTT 34380 

GACTTATGTC TGATACTTTG 34440 

CAAGTTCTCT ACGTTGTGCT 34500 

CCTCCTTATT GAAATGATTG 34560 

GCTCAGCCTC TAGyAAyAAT 34620 

CTTTTGTTAT TCGTTCATTT 34680 

CTTGCTCTTT AAAGCGCATG 34740 

CCTTATTTTG CTGCTCTTCT 34800 

TCATCTTTTA ACTCCTTTTC 34860 

TCATTATCAA AGGAGCTACT 34920 

TTTATATCTC TTTCCACTTT 34980 

TCAAGCCCrA AATACTTTGT 35040 

CCtTTrAgAA AATCGTAATA 35100 

GCCTGTTCrT TAAArCTTCT 3 5160 

ATTAATGCTA AAGCCTCCyT 35220 

CTAGGGGTGG CCGTATAAAA 35280 

TCCTGTGATA ATGAGTCATT 35340 

GAATTTTGTT TTCTCAAAAA 35400 

GTAAGTGCAC TTAAAGAAGT 35460 

TCATCTTTGT AAAAC 35515 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:. 
GTTGTTTATA CATTATTACC TTCTTTGTAT AAAATCTATC CAATAGAAAA GTTTTAAAAT 



60 
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TTTTCTATTG GATTAGCTGT TTTTATATTA TATTTTAAAA ATTTTACATA AGCTTGTCGA 120 

TTTCCATTTT TATATTATCG GACAATCCTC CAAATACAAT TTGAACACTA TTTCCTTTTT 180 

TTAATATTCC ACTGGCACCT AGATTTTTGA AATAGGCGTC TGATTTAATG ACTTCTATTT 240 

GTTTTAGATT GACTCTTAAT CTTGATGCAC ATGCATCAAT GTATGTAATA TTATCTTTTC 300 

CTCCAAGACC CTCTAATACT TTTGAAGCGG TTTCTGATAA GCTTGTTTTT TCTGAACTCA 360 

TCATGGTTTT TTCCATCTCT TCGTCTTCTC TTCCTATTGT TTTAAGATTG AATTTCA^A 420 

TTGCAAATTT AAATATAAAG TAAAATCCAA TAAAGTAGAA GATTCCCAAG ATAGGAATTG 480 

CTATCCAATT TGTTTTGCTA TTTCCCTGAA GTATTCCAAA TAGGAACATA TCTATAAATC 540 

CGCCAGAAAA TGTTAGTCCA ACTCCTACGT TTAAAAGGTG TGTTAAAAGA TATGCTAGTC 600 

CAAAAAGAGG AACATATATA AAGTAATAAA GTGCTGGTGC TGCAAAAAGG AATGCAAATT 660 

CAAGAGGCTC TGTAATTCCT GTTAACATTG ATGTAAAGCT AGCAGATAGT AGCAATGAAG 720 

CTACGTTTTT TTTATTTTCA GGTTTTGATG TATGGTACAT AGCAAGCGCC GCCCCAGGTA 780 

ATCCAAAAAT CATAACAACA AATTCCCCGC TAAAAAATCT TGTTCCTTTT GCAACTTCAA 840 

AGTGTACAGT ATTGGGATCT GCAAGTTGTT TGAAAAATAT ATTTTGTGCT CCTGAGATTA 900 

ATTCGTTATT TATTTCCAAT GTTCCCCCAA CAGCTGTTTG CCAAAATGGC AAATAAAATA 960 

TGTGGTGGAG TCCAAATGGA ATTAAAGATC TTTTTATTGC TCCATATGCA AATGTTCCAA 1020 

AAAGTCCTGA TTGTTCTACA ATTCTTCCAA ACGAAGTCAT TGCACCTTGG ATAAAAGGCC 1080 

AAATAAATGT TAAAAATATT- CCTACCACAA ACATTGCCAT TGTAGTTACA ATTGGCACAA 1140 

ATCTTGTGCC CCCAAAAAAT GCTAAGAATG TGGGTAATTG AATATTATGG AATCTGTTGT 1200 
GAAGAAAGAC . ACSCAAQA^T CCTG ATCC,TCCCAT TACGCTCATT TGAAGAGAGA . . .1260 

ATATTCCAAG TACACTTGTA TATTCCTGGC TTTTTGGAGT TGCAGCTGTT TCAGGCATTC 1320 

CTAATTCCAA TAGTGCTTTT AAGCTTGCGC TTTCTC3GTGT GATTCCTTGT ATGTACAAAA 1380 

TCCCATTTAT AGTTTGATGC ATAACCAAAA ATCCCACTAC TCCTGCTAAA GCAGCTGTTC 1440 

CTTTTTCTAC TTTAGCAAGT CCGATTGGAA TTGCCGCTGC AAACATTAAG GGCAGATTAG 1500 

CAAAAATTAC TTCCCCTGTA TATTTCATAA GATAAAGTAT TGAGTTAGCA ACAGTTCCTT 1560 

TTCCAAGGAC TTCTTCTAAT CCATAAGCCT GAATCATTGT TTCATTAGTA AATGCTCCCC 1620 

CAATTCCCAA TAAAATTCCA GCTGCTGGTA AAAGTGCTAT TGGAAGCATG AAGGCTTTTC 1680 

CTATTTTTTG TAATATTGTA AATATAGATA TAGATGCTGA TGATGTTGAC ATAATTTTCC 174X) 

CCTTTTTATT AAGTGCAAAT TAATTAATTA AAATAATTAA TTTGAATAAT ACGCTTAATA 1800 
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TCTTAACAAG 
TTGCTGTTTA 
TCATGGCATT 
TTAAATTTAG 
CAATTAGCAT 
GAGTAATCTA 
ATAAGTGATT 
TGAGAATTTT 
CTTTTTGCTT 
TTTAGTGAAA 
TTTTCAGTTA 
ATTTTTATTG 
ATGTCTATAT 
TAAACGTTTA 
ACTTTATAGC 
AATTCTGTTA 
ATACTTATTT 
GTAATATTTT 
TAATTTTTAT 
TCAAAACTAG 

aotcgtactg" 
tcgaaaaatt 
taagataaat 

AAATTTTTTA 
AAAAATCCAA 
ATTTTACATC 
TACTTTACTT 
TCCGTTTATT 
AAAGATAAAA 
TCAAATTTTA 



attttttaat^Wtgtaaata 

TAAAATTTTG TATTTATAAA 
TGTTATAAAG CATTGCTTAT 
AAATAAATCG GATCAATTTG 
TGTAAAGTTA AATACCGATT 
TGGGCAGTTT ATTGTCGCCA 
TAATAAAATT TAAATCATAT 
GATTTGTTAA ATTAATATTA 
TTACATTTAT GGCATAAGTA 
AAATATTATT ATTTTTTAAT 
AATTTTGTAG TTGCTTTTTT 
CCTTAAGAAA ATCATCTTTA 
TATTTTTATA ATATTCTATG 
TTAGTTCTTT GAAGTTTATG 
TTTCAAATTT TTTAAAAGGG 
TTTGTCCGTT TGTATTTTTT 
CTGTATTTTC TCCATTTAGA 
CTTTTATTTG TTCTAGTTTT 
AATTTGTTTG AATTTCATAA 
CATTAAACAC TGTATATAGT 
"GAAAATTTAG TAGGTATTTT 
CTTTTTCGAA AATATTAAAA 
TTGAACTAAT AATAAAAAGA 
ATTTATCTCT GATTTTATTT 
TAACAAGGTA CCCAGAATAT 
CTTTTAAAGT TTATTTTTAA 
TATTTTACTA AAAGCATACA 
TTTTATTGTT TTATGGTTGT 
TAAATTTAAC TGTTTTATCA 
AAATAAAAGA CTACGAACAT 



853 
TCAGTATAGA 
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ATAAATGATJ^StATATTGAA 1860 

AAACATTAAA GATTGTTTTT CCCTTTAATT 1920 

AATCTTCGTT TTCATTGAAA TTATTTTAAA 1980 

GATTAGGGTG TTTGCAATGG AATTAATCAT 2040 

AAATATTTAT AGATTTCACT AGTTTTGTCA 2100 

TCTCTGATAT TTGGATTAGC GCCTTTTTCG 2160 

TTTTGAATTA TGGCACTATG AAGAGCTGTT 2220 

AATTCTTTTG TTATTAAATA ATTTATAATA 2280 

AATATTGGAT TGCCGTTGGA AAATATTGTA 2340 

AAAAATTCTT TAAAATCATC AAGTTTATCA 2400 

TTCTCAATGT ATAAACCATA TTCTTTTTTG 2460 

TTTTCTTGCA AGTCTATGTA ATAAGGGCTC 2520 

GGAGTGATAA TATTTTTTTC ATCAAGATAG 2580 

TTTTTATTTT CTGGGATTAG ATCAAATCTA 2640 

ATTAAATTAT AATTTTGATC GTAAAACAGT 2700 

ATAACAGGAA TAATATTTCC. ATTCTCATCA 2760 

ATAGGTAATT TATATTTATT ATAAATAGGG 2820 

TCTTTAATTT CTGAATTTGT TGTCCTAATA 2880 

GAACTTTTTC CAATGTTTTT AGCATATTTC 2940 

GGATCAAATT TTGACATCAA TTCCATTCTT 3000 

TGAAAAAATT GTTCGTTTAT TTTATGTATT 3060 

TCTTCTAATA ATTGCTTTTC GGTGAAGTAA 3120 

GTAAAAAAAG TTAAATAATA TAAAAAGTAT 3180 

CTTAAATTTT TATTGAAAAT TGTAAAAGAT 3240 

AGAAATATTT TGCTTAGCAC ATAATAACTC 3300 

ATTATATCAA AATATTTCTA TATTTTTATT 3360 

ATTAGGCATT AAATGAAGAA GTTTTTAATA 3420 

TCAACTATAT CTTTGGTAAA AATACCAGAA 3480 

TCTTTAATGA ATTATCCTGA TTTGAAGATT 3540 

TTGCATTATT CATCTGATTT TGAAAGCTTG 3600 
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AGTGATACTA 


AAAATAGTGC 


TTATATTTAC 


GTTGATGAAT 


CTAGTTTCAA 


TAATAATATT 


3660 


AATTTTATTA 


AAGATCTTTT 


TATTTATAAT 


AAGAAATTAT 


ATAGAATACT 


TATTGCTTAT 


3720 


AGCTTGACCC 


AAGGTGCATC 


TTTTAAGGCA 


GAAGTTTTAT 


CTTATCTTGA 


AAAACAAAAA 


3780 


ATTATGAAAA 


ATTTTTCATT 


GAAAATAAAT 


TTTCCAACTG 


CTAAAAAATT 


TATGGATAAT 


3840 


AAGTATTGGA 


TTGTAATTGC 


AAAAAACCAT 


TTAGATTCTC 


TTGTTAAGAG 


TAAAAATTAT 


3900 


TTAGTCTTGG 


CGAATGTAAA 


GATGGAATAT 


ATACTCAAAA 


AGTTTTTAAC 


TTGAGAAAGC 


3960 


TTTTTACTCT 


AGATCTTCAA 


ATATTTTTTT 


AATTCGTTCT 


TTTTTTTCAA 


GTTCATATTT 


4020 


TTCCAAATCA 


AGAGCTATTG 


ATTCTTTAAT 


TTTATCTGTA 


TTGTGGAGGT 


AGATGTTGGC 


4080 


TTCTATTTTT 


TCTTTTGTGT 


TTTTAATTTT 


TAAAAATTTT 


TTACTCTTTT 


TTATTTTATC 


4140 


TATTTTGACA 


AGATCATTAA 


TTATGCTTAA 


TTTTAAATAA 


ATTATATTTT 


CAGTTACTTG 


4200 


GAATTCTTTT 


GCTATTGTTT 


TTTGGGGATA 


CTCTTTAGAT 


TTATATTGAG 


ATAATTTTAA 


4260 


TTTTAATGTG 


GTTGTTGGGA 


TCAATATGTT 


TGCTGCAAAT 


ATGTTAGCTT 


CTGTTACCAT 


4320 


TTGACTATCT 


TGAATGTTGT 


TATAATAGTT 


TTCATTTTTA 


GATAGATTTT 


TTATTTGATC 


4380 


TTGATGCATC 


AAATAATGCC 


CCAAGTATTT 


TGCTATTGTA 


AATCTTTTAT 


TTTCAAGGCT 


4440 


CATGTTTTCA 


TTTATATATA 


AAGATTTTTT 


ATTTAATTGA 


ATATATCCTG 


GAAAATCTTT 


4500 


ATTCTTATCT 


TGAAAACTTA 


TTTCGAAAAT 


TTTAAGATCT 


TCTCCCATGG 


CAATTTTTAC 


4560 


TATAGGAACA 


GGAATAAGTA 


ATATTTTATG 


TTTTGATGTT 


ATATAATCCG 


AATAGGCTTT 


4620 


AGAATTTTCA 


ATACT^GAGC 


TGAATTTGTT 


TTCATTCATT 


TAATATAAAT 


ACTCTCCTTT 


4680 


CTGTATTGTA 


TAATATAAGT 


TAATTATGAA 


ATACTGTTTT 


TCTTTGATTT 


TAATGGTTTT 


4740 


TATTTGCTCT 


TCTTGCAAGA 


TTTTAAATAT 


TGCTGAAGAT 


TTAGAAAAGA 


ATTTTGAAAA 


4800. 


AATTGAAAGA 


GCAGATTATT 


TTCTTTATTT 


TTATCCAGAC 


AGTCAAATAT 


ACATTAAAAA 


4860 


AGATAAATCG 


AGCAATAAAT 


TTAGTGTTTT 


TTTAAATGTT 


ATGTTAGATT 


CAAATTTAAA 


4920 


TTTTACTAAA 


GGTCATTTAA 


AATTAATTCA 


AGACAATAAA 


TATATTGGAA 


GCATTGCTAT 


4980 


TTCTAAGGTA 


GTTAGTATTG 


GAAATTTTAA 


GTTTTTGTAC 


ATTAATCTTG 


ATAAAGATAA 


5040 


TTTTACTCTT 


ATGTCAAAAG 


CTTTAACCCC 


TTACAAAAAG 


CTAGTCTTTT 


TATTTAATGA 


5100 


GGATTGTTTT 


CAGGTTTGGA 


CTAAGGATAC 


CTTGCAATAT 


GATCCAAGAT 


TTATTGA1Y3T 


•J X o w 


TAATTTCAAG 


AATACAAAAA 


ATACTTTAGA 


ATATGCATTT 


AAAAACAAAA 


TTTTATAAAA 


5220 


AAACTTACAT 


ATTATGGACT 


TTCTTGAAAA 


TTTTTAAAAA 


ATATTTATTA 


CTTTTTTATT 


5280 


TGCTATTTTT 


AACATTGTCT 


TGTTCTACAA 


TCTATTTTGA 


TGGCATTCCC 


GAATTAAAAA 


' 5340 
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AAGATTCCAA ATATATTAA^^AATTCAAG AGAATAATAA AATTTCTTT^IGACATTATT 5400 

TTACTGTTTC TAATGCTTGG AACTTAAGGT ACAAAGAACC TTTATTTTTA AAAGTTGGAA 5460 

ATGATATAAT TGCCTTATTT CTATTTAATC GGCATAAGCT AATTGATAAT AAATATCTTC 5520 

AAACCTTTTT TAGCGTTGGA AGAGACATTT CTTTAAAAGC TTATTTAAAG CTTATTAAAG 5580 

CGAGAAAATT TGTTATTACA AATAGTTCTG AAAAGATTAT TAAAACCATT GTATTTTCAA 5640 

ACTTACCTGA CAGCGAAGAT ATTCTTTTCC AGAACAATAT GCTTAATAAG GCACAATAGG 5700 

CCTTTAAAAA GAATTAAAAG CCTAATAATT ATTATTGAAA ATATTTTTAA ACAATAAAAA 5760 

GGAAAGTTTT ATGGGTAAGT . ATGTAAAAGG TTTATTTTTT CAATTTAAAA ACAGTGATAT 5820 

TAACTATAAA AAGGAAATTC TTGCGGGCAT TACTACTTTT TTGAGTATGT CATATATTAT 5880 

AGCTGTTAAC CCAGCAATAC TGTCTAACAC AGGCATGCCA ATTGGTGCAC TAGTTACCGC 5940 

AACCTGTCTA ACAGCAGCAT TTTCTACTAT ACTAATGGGA CTTTATACCA ATACGCCTTT 6000 

AGCATTGGCT TCTGGAATGA GCTTGAATGC GTTTTTTGCA TTTTCTGTAG TAATTGGGAT 6060 

GAATATACCT TGGCAAGTTG CATTAGCTGC TGTTTTTATT GAAGGACTAA TTTTCATTCT 6120 

CTTATCTTTT TTAAGAGTAA GGGAGCAAAT TATAAACTCT ATTCCGATAA ATTTAAAATA 6180 

TTCTATTTCG GTTGGAATAG GGCTTTTTAT TGCTTTTATT GGCTTTGTCA GCGGGGGAAT 6240 

TATCATTAAA AATGATGCTA CATTGGTTGG AATGGGATCA TTTGTTGACT TGAAAGTTTT 6300 

ATTTACATTT TTAGGATTAT TTTTTATTGT AATTTTTGAA CAATTAAATG TAAGGGGAAG 6360 

TATACTTTGG GCAATTTGCT CAGTCACTGC CATAGCTTGG ATATATGCAA TCTTTAATTT 6420 

AGAAGGTGCC CAGGCTATTG GAATACAACT TCCCAGCAGG ATTTTAAAAT TTGAATCCAT 6480 

TGGACCAATA TTTAATCAAT TAGATTTTTC TTATGTTTTA AATGAGCATT TTTGGACTTT 6540 

TATATCAATA GTTTTTATTC TCTTGTTCAA TGATTTATTT GATACTGTGG GTATTTTAAT 6 600 

AAGCGTTACA ACAAAAGGTG GCATGTTGGA TAAAAATGGA AAAATTCCTA ATGCAAAAAA 6660 
AATATTACTG GTAGACGGCA TTGCTACTAC TTTTGGAGCA ATAATGGGTG TTTCCACTGT - ■ 672 0 

TACTACTTAT ATTGAAAGTT TTACAGGAAT TGCTGAGGGT GGAAAAACGG GCCTTACTTC 6780 

AATTGTAACT GGAACATTAT TTCTATTTGC AGTTTTTTTT GCCCCATTGT TTATTGCCGT 6840 

TCCTGCTAGC GCAACTGCTG CAGCATTAAT ATATGTAGGA TTTTCAATGT GTAGAGAAAT 6900 

AATTAAAATT GATTTCTTTA ATATTAGAGA AAATATTTCC AGCTTTTTAA TATTTTTTTT 6960 

GATTCCTTTA GCTTATAGCA TTTCTTCAGG ATTTTTTGTT GGCGCAGCAT TTTATATTTT 7020 

AGTAAATGTA TCATTTAATT TTTTTAGCAA AGAAAAGATT AAAATTTCTC CTGTACTGCT 7080 

AATATTATGC TTAATTTTTA TTATTAAATT TATTTATGGC TATTAATATT TCTATAAAAT 7140 
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TTGATTTATC 
TTTGATATAA 
TATTTCAATT 
CTTTTTTAAG 
TGCCAATTGG 
TGGGGCTTTA 
TTGCATTTTC 
TTATCGAGGG 
ATTCCATACC 
TTATTGGCTT 
GATCATTCAT 
TTGAACAATT 
CTTGGATATA 
ATGGAATTTT 
TATTAAGCAA 
TATTTGATAC 
ATGGAAAAAT 
GAGCAATAAT 
AAGGTGGTAA 
TCCTTTCACC 
TAGGATTTTC 
TTCCCAGTTT 
GTATTGGAAT 
AAAATAAAAT 
ATATTTATTA 
TAAATTATAA 
TTTTTAAAAT 
CGTTTAAGCC 
TAAATGCTTA 
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AATATATTTT 
AATAAAATTT 
TAAAAATAAA 
CATGGCATAC 
CGCATTAGTT 
TACTAATACC 
TGTAGTAATT 
GCTAATCTTT 
GGTAAATTTA 
TGTCAATGGG 
TGACTTGAAA 
AAATATAAGG 
TGCAATCTTT 
AAGATTCGAA 
ACATTTTTGG 
TTTGGGCACT 
TCCTAATGTC 
GGGAGTTTCA 
AACCGGACTT 
ATTATTTATT 
AATGTGCAGA 
TTTAATACTT 
AATATTTTAT 
CTCTCCAGTA 
ACCGATTTGT 
ATCATAAAAA 
CTCACATAAA 
TACTTAAAGT 
AATTCAATTT 



ATTATTAGAT 
GAGGAGTAAT 
ACCATTGATT 
ATAATAGCTG 
ACTGCAACTT 
CCTATATCAC 
GGAATGAATA 
ATTGTGCTAT 
AAATACTCTA 
GGAATTATTG 
GTTTTATTTA 
GGAAGTATAC 
AGTCCAGAAA 
TCTATTGGGC 
AGCTTTATTA 
TTAATAGCAG 
GGCAAAATAT 
ACCGTAACCG 
ACAACAATAG 
GCAGTTCCTG 
GAAATATTGA 
TTTCTAATCC 
GTTTTAATT^ 
ATGATAATAC 
TATTTATAAA 
AGAGTCTTTA 
ACCAAAGAAA 
CTTTAAAATC 
ATTAACGGCT 



856 
TAAAATCCAA 
TTGTAATGAA 
ATAAAAAAGA 
TTAATCCGGC 
GCTTAACATC 
TAGCACCAGG 
TTCCTTGGCA 
CTTTATCAAG 
TTACGGTTGG 
TTAAAAATGA 
CATTTTTAGG 
TTTGGGCAAT 
GCGCAGTAGC 
CAATATTTAA 
CT^TTGTATT 
TGGCAGCAAA 
TTTTAATTGA 
CATACATTGA 
TAACGGGAAT 
CTAGTGCAAC 
AAATTAATTT 
CCTTAACATA 
ACATAATACT 
TGTGCCTAGT 
AAAAATTTAA 
TTTTTTAAAT 
CTACTATTAT 
AAATTTCTAG 
TTTGTAATAA 



TAAATAGCGT 
TCAATCCAAA 
AATTATCGGT 
AATATTATCT 
AGCATTTTCT 
TATGGGTCTT 
AGTTGCACTA 
AGCTAGGGAA 
AATAGGGCTT 
TGCTACATTG 
ATTATTTTTT 
TTGCTCAGTC 
TGCTGGAATA 
CCAGTTAGAT 
GGTATTGCTG 
AGGAAATATG 
TGCCATTTCT 
AAGTTGCACA 
AATGTTCTTT 
. TGCTGCAGCA 
CTCTAATATA 
CAATATCTCT 
TAATTTATTG 
TTTTATTATT 
AATTTGCAAT 
AGTTAAGTCT 
CTTTAAAAAT 
CACCCAATTT 
GTTTTTATTC 



TGGTTTTATT 
GAAACATTGT 
GGTATTACCA 
AGCACAGGTA 
AGTATATTAA 
AATGCATTTT 
GCTGCTGTTT 
AGTATTGCAA 
TTTATTGCCT 
GTTGGAATTG 
ATTGTAATTT 
ACTGCCATAG 
CGTTTTCCAG 
TTTTCCTACA 
TTTAACGATT 
TTAGACAAAA 
ACTACTGTTG 
GGAATAGAAG 
ATTGCAATAT 
CTAATATATG 
AGAGAAAATA 
TCGGGGATAA 
GAAAATAAAA 
AAATTTATTT 
TTCA/^AAACC 
ATTTAAC7UVC 
TTGCCAAAAC 
TGTTTATATT 
TTTAAGAGAA 



7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

882-0 

8880 
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GAGCTTAAAG TTAAAATGAA TTTTAAGAAA TTTTTTGAGA AAATAAAAAA ATAAAAGCCA 8940 

AGAAATCTTT CTTGACTTAT ATTGACTTTA TTTTTCCAGT TACTTTTTTA AAACAAATTA 9000 
ATCTTATAAT ATTGATCTTA ATTAAGGTTT TTTTGGACTT TGTGCCACAA CAGGGCTTGT 9060 
AAGCTCTTTA ACTGAATTAG CAAGCATCTC TTTAGCTGCT TTTGACAAGA CCTCTACTGA 9120 
TTCAAATAAT TTTCCAAGTT CTTCAGCACC TTTAGTTTTA GTACCATTTG TTTTTAAAAT 9180 
QQ^I^IupCipTTT GCATCAGCAT CAGTAACACC TTCTTTACCA AGATCTGTGT GTTTTTCTTT 9240 
TAATTTATTA GTAAATGTTT CAGAACATTT CTTAGCCGCA TCAATTTTTT CCTTTAATCC 9300 
TTCATTTTTC AATCCATCTA ATTTTTGTTT TATTAGGGTT GATATTGCAT AAGCTCCCGC 9360 
TAACAATGAT CCATTGTGAT TATTTTCGGT ATCCAAACCA TTATTTTGGT GTATTTTTTT 9420 
ACCAATAGCT TTAGCAGCAA TTTCATCTAT AGATGACAGC AACGCTTCAA CCTCTTTCAC 9480 
AGCAAGTAAA ACCGCATTAG T^TCCGTAAT TTTTTTACTT ATTTCTGTAA GATTAGGCCC 9540 
TTTAACAGAC TCATCAGCAG AATTTGCAGA TGTATTCCCA TCTTTCCCTG AATTATTACA 9 600 

AGATATAAAT AAAAATAAAG TCATTAATAT TGCACTTAAT GTATTCTTTT TCATTAATTT 9660 
GTGCCTCCTT TTTATTTATG AATTATTAGT CCAACAATTT TGTTTTTCAA TTTTTTATTT 9720 
GAAAAAATAA TTTTTTCAAA TTCTTCAATA TCTTGAATAA ATATTGAAGA ATTTGAAAAA 9780 
TATTGTCTTA ATTTGATTTT AAAATCGACA TAAGCAAAGC CAAATATGCT AAAATTAAAT 9840 
GAAGTATACT TTAATAATUU^ AAGTTTTAAT TTATTTAAGG ACTTATATAA TGAATACTCA 9900 
GGCAATACTT GTATTAGATT TTGGATCCCA ATATAGCCAA CTAATTGCAA GAAGAATTAG 9960 

AGAAATTGGC GTTTATACAA AAGTAATACC TTACTATACT CCTTTAAAAG AAATTAAAAA 10020 

TATGAATATC TCAGGAATAA TACTAAGTGG AAGTCCTGCT TCTGTTTATT CAAAAGAAGC 10080 

TCCTACCTTG AATATGGAAA TTTTTAATTT GAAAATACCT ATTTTGGGTA TATGTTATGG 10140 

AATGCAAATA ATTGTTAAAT TATTTGGGGG CCTAGTATCT AAAGACTCTA AGCAAGAATA 10200 

TGGGAGCTCT GAAATCTTTC TAAGAGATGA AAAATCTCTT TTATTTTCAG AACTTCCAAA 102 60 

CAAATTTCAA ATTATCATGA GTCATGGAGA "CAGTATTGAA AAAATTCCTG ATAATTTCAA 10320 

ACAATTAGCT TTTACAAAAA ATTGTATTGC TTCTATATCA AATGAAACTC AAAAAATTTA 10380 

CGGCCTACAA TTCCATCCAG AAGTAACTCA TTCTGAATTT GGTGATCAAA TAATTAAAAA 10440 

TTTTGTTTTT AAAATTTGCC AAGCCCAAAT TAATTGGTCA TTAGAAGGCA . AT^ CTAGAAAC 10500 

CATTGTGAAA AAAATTAAGC TTAAAGTGGG AAGCAAAAAG GTTATTTTAG 'IGACTTTCTGG 105 60 

TGGCACAGAC TCTTTAGTTT GCGCATTGCT TATAAAAAAA GCTATAAACG AAAATTTGAT 10620 

CTGCGTTTTT GTAAACACTG GATTGTTGCG CAAAAATGAA GATAAAAAAA TACTAGAATT 10680 



m 



wo 98/58943 _ PCTAJS98/12764 

.9 858 

AAAGCATCAA TATGATTTAA ATATAAAATA TATTGATGCT TCTACAAAAT TCTTGAACCG 10740 

TTTAAAAAAT ATAAGTGATC CTGAGGAAAA GAGAAAAATA ATAGGAAAAG AATTTGTAGA 10800 

TGTTTTTGAA AAAATTACTC TAGAAGATCA AAATATAGAA TATTTAGCTC AAGGAACAAT 10860 

TTATTCTGAC GTAATTGAAT CTAAATCAAA AGACAGCTCT TCTTCAAAAA TCAAGTCTCA 10920 

TCACAACGTA GGGGGACTCC CAGATAAGAT GAGTTTAAAA CTCTTAGAAC CTTTGAATGA 10980 

ATTTTTTAAA GATGAAATAA TTCAAATCGG AATAAATCTA GGTATTAAAA AAGAATCTCT 11040 

TTACAGACAT CCATTTCCCG GCCCAGGACT AGCTATAAGA ATAATTGGAG AAGTAACACA 11100 

AGAAAAGATA AATATCTTAC AAGAAGCAGA CAATATTCTA ACAGAGGAGC TTTTTATAAA 11160 

TGATTTATAT TATCAAATAA GACAAGCATT TGTTGTATTG CTTCCTGTCA AATCTGTAGG 11220 
CGTAATGGGA GATCAAAGGA CATACGAATA TACAGCTGTA ATTAGATGTG TAAATACCCA . 11280 

AGACTTCATG ACTGCAGAAT GGACTGAACT TCCTTACAGT TTTTTAAAAA AAGTTTCTTC 11340 

AAGAATAATT AATGAAGTTC GGGGTATAAA TAGAGTTTGT TATGATATAT CTTCTAAGCC 11400 

TCCATCAACC ATAGAATGGG AATAATAAGA ACAATAAAAA GGAAAATTTA TGCCAAATAA 11460 

GATAACAAAA GAAGCTTTAA CTTTTGATGA TGTGTCTTTA ATTCCAAGAA AATCATCTGT 11520 

ATTACCTAGT GAGGTTAGTT TAAAAACACA ATTAACAAAA AACATATCCC TAAACATACC 11580 

ATTTTTAAGC TCAGCAATGG ATACTGTTAC AGAAAGCCAA ATGGCAATAG CCATTGCTAA 11640 

AGAGGGTGGA ATAGGAATTA TACATAAAAA TATGTCAATA GAAGCTCAAA GAAAAGAGAT 11700 

AGAAAAAGTA AAAACATATA AATTCCAAAA GACTATTAAC ACTAATGGAG ATACAAATGA 11760 

GCAAAAACCC GAAATATTTA CAGCAAAACA ACATCTAGAA AAATCCGATG CATACAAAAA 11820 

' TGCAGAACAC AAAGAAGATT TTCCTAATGC ATGCAAAGAT TTAAATAACA AGCTAAGAGT '11880 

AGGTGCTGCT GTTTCTATTG ATATTGATAC CATAGAACGA GTTGAAGAGC TTGTAAAAGC 11940 

ACATGTAGAT ATACTTGTCA TAGACTCTGC CCATGGACAT TCTACAAGAA TAATAGAGCT 12000 

TATCAAAAAA ATTAAAACCA AGTACCCAAA CTTAGACCTT ATTGCTGGCA ACATAGTAAC 12060 

TAAAGAAGCT GCATTAGATT TAATAAGTGT AGGAGCAGAT TGTTTAAAAG TAGGAATAGG 12120 

TCCGGGTAGT ATATGCACAA CAAGAATCGT TGCGGGAGTT GGAGTTCCCC AAATAACAGC 12180 

AATCTGCGAT GTCTATGAGG CTTGTAATAA TACAAATATT TGTATTATAG CAGATGGCGG 1224*0 

AATTAGGTTT TCAGGAGATG TGGTTAAAGC CATCGCAGCA: GGAGCTGATA GCGTAATGAT 12300 

AGGCAATCTC TTTGCAGGCA CAAAAGAATC TCCTTCTGAA GAAATAATTT ACAATGGAAA 12360 

AAAATTCAAA TCTTACGTTG GAATGGGCTC TATTTCTGCT ATGAAAAGAG GCTCCAAATC 12420 
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AAGATATTTT CAACTAGAAA ACAACGAACC TAAAAAATTA GTCCCCGAAG GAATTGAAGG 12480 

CATGGTACCG TATTCTGGAA AATTAAAAGA TATTTTGACT CAATTAAAAG GCGGTTTAAT 12540 

GTCTGGAATG GGCTATTTAG GAGCAGCAAC AATATCTGAT TTAAAAATAA ATTCTAAGTT 12 600 

TGTAAAAATA AGCCATTCTT CATTAAAAGA ATCCCATCCT CACGATGTTT TTAGCATAAC 12660 

ATAAAAATAA AAAACATTTA TCAAATTAAA TAACTAACAT CTTTAAAAGA TCAAAATATT 12720 

GCATCCTTCT TTTAAAGAAA TAACAACCTT GGTAGGAAAA GAATAATAAA TATAGCTTTC 12780 

TGTTTTTGTA ATGCTTTTTC TAGTATTAAT ATATTAATGC TTACTCTATT TAAAAATAAT 12840 

AATTCTAAAA TAATTAAGTT AAAGAAATGA ATTCTTAATT TAAGAATTCA TTTCTTATTT 12900 
TTGTTTATAG CCAAATCAAA AGATCTAGCT ATAAACCATT TTTACTTAAA TCATTTAATT . 12960 

GGTTTTATTT CAGATAAATT AAATCTTTCC GAAATATTTG GCTCCCAACC TTTCCACTTG 13020 

TCGTTTCTAA AAAGATAACT AGAAGAAGTT ATATTAAGIAA ATACAGCCGG AAAATCTCTT 13 080 

TCAATTATTA TTGCTTCTGC TTTTTTTAGA ATTTCCTGTC TTTTAAAAAT ATCTCTCTCA 13140 

TTATCTGATT TTATTAAAAG TTCATCATAT TCAGAATTTG AATATCCATA AGATGAAAAA 13200 

GATGTATTTT CAGTTTGAAA GATGCTTAAG AACGTCATAG GATCAGCATA ATCTCCTGAC 13260 

CATCCTGATC TTATTATTTC ATAATTACCA TTTACTCTAC TATTTATATA TGTTGACCAT 13320 

TCTTCATTCT CAAGCTGTAC ATTAATATTT AAGTTTTTCT TCCACTGATT TTGAATAAAT 13380 

TCAGCAATTT TTCTCTGGCT ATCACTTGTA TTGTACTTTA CTTTTAATAA AGGAAAATTA 13440 

TTACCATTGG GATATCCTGC ATCTGCCAAA AGCTTCTTTG GCATTTCAGC ATCAAATAAG 13500 

CTCAAATTGC TTTTATAAGA GTAATCAATA TAATCTGGAG TTCQTCTTCT TGTAGGAATA 13560 

GAACTATCAT TAAGAACGCT CTCTGTTAAG GTTTTTCTAT CAATAGCAAA AGACAGCGCC 13 620 

TTTCTAACTT TAACATTGTC AAGCGGTTTT ACTTTCATGT TCAAAGAATA AAAAGAGGTT 13 680 

GAATTAATAC CCATTGAATA ATAATCGTCC CTAAGCTTAA GATGCTTAAG CAAATCTGGT 13740 

GGAACATTCT TAAAAATTGC ATCCAGCTCA TCATTTAAAT ACATATTATA AGCTGTAATG 13800 

CTATTATCTG TGACAAAAAA TATAATACTG TCAAGAACAA CATCTTTGGA ATTATAATAT 13 860 

TTATTATTCT TTTCAAGAAC AACCTTTTCA TTTAAAACTC TAGATTTTAA TTTGAAAGGA 13920 

CCACTAACAA CCATATTCTC GGGGTCTGTC CACCTTTGCC CATACTTTTC AATAACGTGC 13980 

ATTGGTACAG GAATAAATGT TTGATGTACT AACATATCAA GAAAATATGG CTTTGGAGAT 14040 

TTTAGCGTTA TTTCTAAAGT TTTTTCATCi^:' AGAGCTTTAA TTCCAAGCTC AGACTCATTT 14100 

GCTTTGCCGT CAAAATACTC TTCTGCATTT TTAATAACGG ACTTAATCAT GTTAACAAAA 14160 

GATGAGCCGG TTtCTTTATC TAAAATTCTA AGATAAGATT TTCTTATTCt TCGGCAGTAA 14220 
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TGGAAACTCC ATCACTCCAA ACAAGATTAT CTCTTAAATG 
CATCAGAAAT ATCCCAACTT TTAGCAAGTC CCGGTCTGTA 
CATCTAAAAT GCCAAGAAAC ATTTGGCTTA CAATCCCTGA 
ATTGAGCATC TAAAGTAGCA GGCTCACTTC CAATATTTAG 
TATTACTTTC ATTAACACAA GAAATAAGTA AAATTAAATT 
ACTTTTTTAT CAATATTTTC ATACAAGCAT CCTTACAAGT 
CCTATATTTT ATTATATATG AAATATAATT TCACATTAAC 
TATTCTAAAA TAAAATTAGC ATTTTACATT AAATAAGCAA 
AAAGATTATA ATCTTTTATT GCTTGCTCTC CAATGGTTAT 
TTAAATTTAA TTATTTATCT ATTTGTAAAT TAGATTTATT 
AAAAAAATAA ATTAATATTG AATTTTAAAA AATTAGAATT 
TATTTAACAC TTCCTTTGTG GCAATAAAAG TTCTATACAA 
CACCTTTTAA AGAGTTTAAA AACTTTCTTA TATATTTCTA 
AAGTAGCAAC CAAAAATCCC TAAAATAATG ATTTAAAGAA 
AAATTGTTTG CAATGATCTA ATAAAAAATA TATTATTATG 
TTATCAAAGG AGAGGAATAT GATATTATAT CAAAATCAAT 
GTATTTTTTT TATTAATATC TTGCACTTCC TTAAACGTTG 
ACATTTAGAA TATACCAAAG CTTAAATAAA AATGCAGAAC 
AAAACAGGAA TAACTAAAAT AGTATTATAC ACAAGGTTTA 
CAGAATCCTT TATTGCTGCT GGATGGAACT AAZ^TTGAGG 
GATAATAACC ATTTTTTTGG CAACTGGATT AATTATTCAT 
TTATTGGAAA GGATGATTAA AGAAGAAGAT GCTTCTTATA 
AGAATTGGAT TAGAAGATTT AAGCTTGAAA AAATATAAAA 
GTTGAATCGA TTGAA/^TAA AGATTATAAA AGTTAATTTT 
TTCAGTTTAA AATAAATTTT TATTGCAAAA TAGAATTGAT 
ATTTTAATTC TTTGCAAAAA TGACAAAGGC TACCTTGTGG 
TCAAACAACA AGAGCGAGAC ATTGCATCTC AATCTATATA 
TTTTTTTGTA AAGTGTTTTT GAAACATTTT TTAAATATAG 
ATATTATTTT TTATTTTTCA AATTGTCATA TTTATTTTTA 



AAACGTATAA 

TCCTCCAGTC 

TCCAACCGTA 

CTTAAAAACC 

GAGAAATAAT 

TTTTATAAAT 

GTTATTAAAA 

AATAATTGAT 

TATACATATA 

TAGATTTATT 

AAATTCTAAA 

GAACTTTCTT 

ACAAAAGCAA 

ATAAAAAATT 

TTCACTAGTT 

TAAAATTTTT 

AGCACGATCA 

TTAAGGGTAT 

GAAACCATAG 

G/iAAAGTAAG- 

CATTTGTTTT 

AGAATAAGGA 

TTTTGGACTT 

TTAATTTATT 

ATAGAGGCTA 

TAGCCAACTT 

GATTATTATA 

TACTATTTTA 

ATATTTATAA 



ACTACTCCGT 

CTGGGATCTC 

TCGTTTATTA 

AATTTGTTTC 

ACAACTTTTA 

TTAAATTTTG 

GCACTTAAAT 

CTTATATTGA 

AAAAATAATT 

ATTTTTTAAT 

CTAAATTTCA 

GCTTTTAAAA 

TGCTAAACAA 

AATTTATCAA 

TATAATTTTT 

AAAATTGTTG 

ATTTGGAAAA 

TTTTAATTAT 

TATAACAGAA 

CTACAAAAGrk- 

GACCAAATCT 

GGTTAAAATT 

TCTAGTAATG 

GGTATTTATT 

TATTATTCCT 

ATTATTCTAA 

TAGTATTTTA 

TAAATATAGA 

GTAGTTTTTG 



14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
.14760 
14820 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
-15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
159t)0 
15960 
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ATTATCATAA TATAGCTCTT 1[*TAATAAGAA GCTTACAAAG TTTGTATTTG ^TTTATAAAA 16020 

ATTAAGGCTT TTTTCGTCTT CAATTTTTAG CCTAAGTGAT CTATTTAATA TCCTTTTTGA 16080 

ATTAACTATA GTCTCATTAT TTTCTAAAAA TTGCATAGCA TAATATATTC CTTTTTTTAA 16140 

AATTAATTCA TAATTGATTT TACCACTGTC AATTCCTATT GCTAGTTTAA TATATCTATA 16200 

.AACAGTAGTT TTTGCCATAT TATAATCTTT TATAAAATGA CCAAAGCTTT TATATTTGTC 16260 

TATAACATAG TACTTATTAT CATTAATTTC TTTTAGAATT CTAGCTGTTT CAATTTTATT 16320 

GTAAGATTCC TCTTTTATCA AAATTTTTAG TTTTTCTTTC AATTTTAAAT ATCTAGATTC 16380 

TCTGCTTTTT TTTATTTCAT TTCCACTAAG CTCAATTCTT TTGACAATTT CTATTTTTTT 16440 

ATTTAATTTC ATCTTTTATT TTTACTCCAT TGCATAATTT CAAATTAGTT CCATATGGAA 16500 

CTTTTAGTTC CATATGGAAC TAATTTGAAA TTATGCTTAA AAAATTTTCA AGTATATTTT 16560 

CATAAGCTTT ATAATAATCT * TCATTAGAAT TGAATTCTTC TCTGTAAAAA ATGGTTTTAC 16620 

GTAAATTATC TCTTTTTGGA ACACTTCCTA AAAATTTGCC TTTATATTCG CATTCAATAA 16680 

ACTTTTTAAG TTCTTTATCA ATATTTTGTC TTTCAATAAA TTTGGTTATT AAATAAAATA 16740 

TTGGCAAATC CTTTCTAAAA AGATCATCAA GCCTGTTAAT TATTAGGTCT AAACTTTCAA 16800 

TTGCCCATTG GTCTGTTGGC AAAGGTATGA TTAAGTAATC TGAGATGATT AAACTATTAT 1686.0 

TGAGCAAGCT TCCTAATGTG GGTGCAGTAT CCATTATAAT AAAGTCGTAT CTGTTTTGAA 16920 

TAAAACTTAA GAAAATTTTG AGTAAATTTT CTTTCAATGA AATACTTTCT TCATTAAATC 16980 

TACTCAGGTT TATGTGGCTT GCTATGAAAT CTGTATTATT ATCTATTTTG ATTGTTGAAT 17 040 

TTTCTATGTC TATTTCTTTT TTAAGAACTT TATATATATT GATATCTTTT GGACTAAGGT 17100 

TTTTTTTTCT TAATATATTA ATATAAAAAC TTGTACTACT TGCTTGTGGA TCTAAATCTA 17160 

TTAATAATAT TTTATTATTT TTTTTTGAGA GTATGTTTGT AAACATTAAT GATGTTGTAC 17220 

TTTTTCCCAC CCCCCCTTTT ATTGATGCAA TTGTTATTAT TTTTGTGTTT TTTTTATCCA 17280 

ATTTACTATC CCTTTATTAC TTTCATATTT TTTACCATAA AATTTATGTA TTTCTTCTTC 17340 

AATTTTTAGA GTTCTTTCTA AAAGAGATTT ATAAAAAAGT TTATTTTTAT TTTTTATCTT 17400 

GGTGAATATG TATAAGCTTC TTAAATAACA AAAAACGCTT CCTTTTTTAA ATTTGAATTC 17460 

CATATAAAAT ATTTTTTTTA ATCTTATTGT TTTTTTTGTT CCTTTTTCTG AATAATTTAT 17520 

AACAAATGGT 'CfTTGGTAGGT TTTTAAAACC ATAAAAAATT CCTAAAAATT TATCGTTTTC 17580 

TTTTACTGAA AATAAATGAA AACTTTCGTA TTTTTTATTA TTAAATATAT TTCTCAGACA 17640 

TAGCCAAAAT TTTCCTTTTT TGGGTTTTGC TTCAAAATTA TTTATCATGC TAAAGATTTT 17700 

TGTGTGATAA ATAATTTTGT TTTCTAATTT TTCAATTTTG TTGAAAAAAT TTTTTTTTGT 17760 
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TTCTTTATTT TTCATTATAT TATTTTTGCT TTACTTTTTA ATTTTTTTGT CATATTTTTG 17820 

TTTTTTTATT AGAGTCTTCA TTAATACAAT AGCATTTTTT ATGTTATTTG ATGTATGTAT 17880 

TTGGTTCTCG TTTTCATAAT TTTTTTCTCT TTCCATTTTG TTTTTAATTT TAAATTTTTT 17940 

TATTAGTTTA TCAAAGTCTG TATTTTTGAA TTTTTTTGCC ATAAACCATA TTTTTTGTTT 18000 

CTTTTTTTCT AGATTTTTTT TATAAAATTT TATAATTTTT TTTTCTTCAT ATTCTTTTAA 18060 

TTCTTCCATA AAATCTTTTA AGTTCCATAA TGAATTCTTA TAAGTTATGT CGTTTTCTGT 18120 

TATTTTTTTT ATTTCTTCTA GATTTATTGA TTTTGATTTT TTTTTTATTT CTTTTTCTAA 18180 

GAAATTTATA GTTTTTTTTA TGTTTTGATT TTTTCTTCTA AAAGAATATT TAGAATTCTT 18240 

ATATTTTTTA CTTATATTAT TACTTAATAC ATGTGAAGTT ATTTGATGTG AAATTTTGTA 18300 

TTTTTGAGAT TCTTCTATTA TTTTAATTTT TTTTAGTTGC TTATTTTTTG ATTTTTCATG 18360 

TTTTGTTTTT TTGTCAATAA AATATGCTGT ACTGATAATT TTTTTAGCTA ATTTTTCAAG 18420 

GGCTTTATTT ATTGTATAGT AAGTAAAACT TCCATTGTTT TTTCCAAGTG GATTGAAATG 18480 

ACTTTTAATT AATCCTAAAG TTTCAAAAAT TTTTATATCA TTTTGTATCG TCCTTTTAGT 18540 

GACCCTTTTG AATCCTTTTT TTTCCAATAT AGAATTTGTC ATTGCTACAA CATTGCTTAG 18600 

AGAGTATTTT TTTTTAGATA TGAAGTAGTT GGCGCTTAGT TTTTGGATGA CCCAAAATAT 18660 

TTTCAATCTT CGGTCTACTA CTTTATTAAA AGGCATCTTG TTGGTTTTTA TTTGATACAT 18720 

TTTAAGCTCC TATCGTTTGA TCTTTTATTG CATTAAGCAC TAAAATTAAT AGTAATACAC 18780 

TTATTTAAAA AAGTAAAGTT TTGTTGGTGA ATTTGCATTC AAATGTGTAA GAGTCAATAA 18840 

GTTAAAATTT ATGCCTACTT GATTGCAAAT TTTTTATGCA ATGATCTACT TCTTTTAAGA 18900 

ATTTTAAAAG AAGTGGTTTA , TATATTTCAA. . ATGTGAATTC. TCCCTTTTCT CCGTAAGATT 18960 

TTAATTTTAG AGTAATATCT TTTTCAATGT TTTTTGCTAG CTCTATTATT TTTTGAGGAC 19020 

TTAATACTAT ATTTAATGTT TCTTTTATTG TTTTTGAATT CTTTAAGGCT CTCACAGGAG 19080 

GCTCCATTTT TAATTTTCTA TCATTCTCAT CATAAATAGA GTTTAGAAAG CGTAATTTAT 19140 

CAGAGTATAA GCTTAAATTC AAAAACAGTA TATTTAAATT TTCACAGGGG TAATAATTTG 19200 

CTATAACAAA TGTTTCGTAA GTTTCAGAGG GAGCGTCTGA TTTTTCT^AAT AATTTTGGAA 19260 

TTTTCATACT GTAGATGTAA TAATGCTCTA TTTCATTATA TTCTGTTTTA AGCTCTGTTT 19320 

TTTCAATTTC AATTTTTCTA TTATCAATAC GTTTTTGCAA AATATTTTTA GATATTTTAA 19380 

* TTTCTTTATC AAAATCTGTT ATATATGCTA AAATATACTC CTTATTAAAT TTTATACTGT 19440 

GCGATAGGTT CCAATTGTCC TTAAAGTCAA TGTTAATGTA TTTCCCTGTG CTTTTATCGT 19500 
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AAATGTAGGT TAATAGATCT 
AGCTAGATTT- TACTTTGAGT 
TCAAAATATT TTCAGGATCT 
AATTTTCTTT TTCTGTTAAA 
TTCTGCTTAT TATCGAGTCT 
GTAGATTGAA ATTACCATTT 
TGTTTTTAAG GTATTTCATT 
ATTTTAGTGC AATAATTATA 
TTATGCAAGC TTTTCTTTAA 
GAAAAAAAAG TTTAATTTTA 
TGTTTCTTCA ATTTTTATTA 
TGAATCGTTA GGAGATGGTA 
TATTAAAGAT ATTAGTTATT 
TACAATGAAA TTGACTTTAA 
TTTTTTTGAT CGTAAATTTA 
TAGCGGTATT GATAGTTTTG 
TCAGAATTTT GCCACTATTA 
TGAACTTAAA AATAATATTG 
TGATAGTTCT AAAAATCTTG 
TAAAGCAATT GAAAAATTTT 
CTATTATTTT GAATTTTTCC 
TTATTTTCCC AACTACGTTT 
GTTCTCCTGT ATAACCCAAG 
CATTTGGAGA ATGTACAGGA 
GAATTCTATA GGAATTAATG 
TTTCTACTGA ATTTGCATCT 
CCTTTGATAC TTTTTTTAGT 
CTATTCCTTC TTTGAAAAGA 
CTAGCGTAGG AACACCTTCT 
TAATAAATGC GGCTGTTGGG 
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^TTGAATTAG TTAGTGAAAT 

TCTGCTTTAT ATTTTGAATA 
ATTTGTAATC CTTTTTTTTT 
GGGTTGTATA CTCCCACAAT 
TCTTGAAATT TTAGTTTTCC 
GGGATGGATT TGCAACCTAA 
TTTTGTTCCT TAAGTGATTC 
TTCTTTTTGA TTTTAATTAT 
TATTAATATA TTTTAGTATA 
TTTTTCCCTT TATTATTTTT 
GACCTTTGGA TGAGGTAATA 
AATTTATU^C CGGCATTCAT 
ATTCTTATTT TTTTATTTTA 
GTTCTAAAAA AGCAAACTTA 
AATTAGAAAT TGTTAATTTA 
ACAAAAAAAT TTCTTTTAAA 
TTTTTAATTT GGACGACATA 
AGGATCTTAA TTCTTCTACC 
ATTTAAGAGA GTCTTACATT 
TACAATAAAG AAACTTTTTA 
CAAGGTTCTA TTTTTTCAAG 
ACAAGACCAT TATTTGGGGT 
TATTCTGAAG AATCTATTAG 
AATTTTTTAT TATTGTAGTA 
TCACCTCTAT TAAAATGTAA 
GGATTTAGGT CTGCTTTGAG 
TCTGTTTCAC TTGGAAAACA 
TCTTTTGCTT GGGTTTCTAT 
TTTTCTTTCC CTCGTGCGCA 
ATTGAATAAT GTTTAAATAT 
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ACTGATAATG^TTTTATTAA 19560 

ATTAATTTTT TCTTCATTTA 19620 

GATGAAAATA TTGACTTTAA 19680 

GGATATTTTA TTATCATAAT 19740 

TAATTTATGG TTTGTATCGT 19800 

AATTAACAAA AATAAGGAAA 19860 

TATATAACTG TATAAATTTA 19920 

TAAAGAATTT GTTATACTTT 19980 

TTTAATGAGA AATTTTAGAT 20040 

TTGTTTTCAT GCAATATTAG 20100 

AAAAGTGAGA TTGCTTTGTA 20160 

GCTAAGAATT ACTTTGATTC 20220 

GATAAATTTA GCAATAATAT 20280 

TTAACCTATG ATTTTGGTAT 20340 

AATTCAAATG AACCTGAATT 20400 

AATAGAATCA ATGGTAATAT 20460 

AGGGCTATTA ATCGGGAGTT 20520 

AATGAATTTA TATATTTTCT 20580 

ACTGTTTATT ATTATGTCCT 20640 

TTAGTGCATT TATTTATTTT 20700 

TAGATATATT TCATCATTGA 20760 

ATCTTTTAGT GCTATTTGAA 20820 

GATGTCTCCT TTTTTAATTT 20880 

CACTCTTGGC ATAGTTGATC 20940 

ATTTTCAAGG ATTATTTCTT 21000 

CTCTAAAATA TTTCTGTTTA 21060 

ATTAGAAATT AGGACTGTAT 21120 

ATCTTTAGAT CTATGTGATT 21180 

TTCTTCTGCA TTATTAGAGC 21240 

TTTTGTTGTT TCTTTAAAGA 21300 
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AATTTCTTGA AAGTCCTGTA TATTTGTGAG GATAAAAATT 
TTATATTAGG CTTAAAATAC ATTATTGTAT CAATATGTTT 
GTTGAATCTT AAGGTCAGAG TCGTTAAAAG TCATTAATGA 
TATTGTCTAA TCTAATTGCC CAGGCGCCAA GCTTTTTAAA 
TTCTAAGATT TGAAAGATGA ATGCCTAATT CTTTGAAAAT 
TAGGTTTCAT TCCGTTTTTA TTTGCAATGC TAAGTAATTC 
TTCCGTTAAT ATAGAGCAAA GAGGTAAATA CTTGAGTAAA 
CAAGATATTT AATAATTTTA TTTTTAGGAC TTACATTGGG 
CTTTCATTTT AGCCTTCCTT AAACTGAACT TTTATTGTTA 
TAATACTTTT TCGCCATTCA TTGTTCCATA ATCGATTGTG 
TCCTTTGGGT TTTGTGATTT CTTCAAGTCT TTTTTTATTA 
TAAAACAACG TCAAATCGGT CAACAACTTC GCTAAGGCGT 
TGTTGCATTT ATATTTTTTG ATTTGGCATA TTTTTCAATT 
GGACATCCCA GCTCCACATA CAAGTAGTAT GTTCATATTT 
TTTATTATTT TGTAAACATT GATTAATTCT TCAAAAATGC 
ATTAAATGAT CTTCAGCATG AATTAAAATA AAAGGCGTTT 
GCTGATTGAT GTATTATTTC TCTGTGTGCT TCATGGGCCT 
TCTTGTATAG TAAGCTCTGC CTTGTCATAT TCTTTGTTTT 
CTTAGAAAGC TTTTAGCCTC ACCAGAGTAA GCTACAACAG 
-AAT-TCTTGTA TGCTATATAT TTTTTTATTC ATGTATAAAA 
AGCAATAATT AATATTATTT AATATATCTT ACAAATATTA 
ATAAATAATT TTATTATAAA TATATCTTAT AAGGATTTTA 
ACCATGTTAT TATAAATATT GTAAGTCATT AATTATAACT 
AGATAAATTA TATTATAATA AATATTGTAA GTTATTAATT 
ATTGGAGGAT GGTTTTCATG AATTTTCAAG ATTTTATTGA 
CTAGCAAAAT TGGTTCAAAT AGATATTTAA TTGCTTTAAG 
TGCCCTTTTT AATAGTTGGT TCTTTTATTT TACTTTTAGT 
CTCAAACATT GTTATACCAA CAGTGGTATG TTGATTTAAT 
TTGTTCAGCC ATTTTATGTA AGTATGGGTA TTATGTCTAT 
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ATGACACCCA AGTAAATTTT 213 60 

ATTTATATTG CTTATATTAA 21420 

TTCTTCAATG CCTGTGAATG . 21480 

ATAATCTAGT TTTGGACAAT 21540 

TTCAGGACTT ACGTCAATAA 21600 

TTTGAATATG TCAAATTCAT 21660 

TCCAAAATGA GCACTTTTTT 21720 

GTATATGGAT ATTCCAATTT 21780 

AATGCATTGA TTGCAAGTTG 21840 

TTAATTATTT CGATTGGAAT 21900 

AATCTTGACT GTGGTGCAAG 21960 

GTCTCAGCAA TAGCTTCAAT 22020 

CTTTGTACCA GCATACTTGT 22080 

TCTCCTATTT TTTTATTTCA 22140 

TTAATTCTGA AATTGCAGAC 22200 

TGACAGAGTT TGGATTAGTG 22260 

TTGCAATGGA TTTTTTACTT 22320 

TGGCATATTC TAAAGCTTCT 22380 

GCATGCTTAT TTTGTCTATT 22440 

TATAGTCCTT TTATTTATAA - 22500 

TATTATAAGA TATATTTAAA 22560 

TTATCATTGC TATTAATTAT 22620 

TTTAATTAGT TTTTATTGAG 22680 

ATAACTTTTA ATTAGTTTTT 22740 

AACTACTTTA- GTTCCTATTG 22800 

AGATGGCTTT ACTTTTTCTA 22860 

TAATTTGCCC TTTACAGATT 22920 

GGCTAAATAT AAAGGAAATC 22980 

ATTTGTTGTT TTTGGTATTG 23040 
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GTTATAACTT 
ATACATTTTT 
AATGGGGAAT 
AAGGAGTATT 
TTCAAAAAAA 
TTGAAGCTTT 
TTCAAAGTTC 
TGCAAATTAG 
GGTTTTGTGG 
CAAATCTTGA 
CGGGGGGATT 
CTATTGCTAT 
CGCCTGGTCT 
CTATATTAGG 
TTACTAATTT 
CTATTGCAGC 
TATTGATTAT 
TTTTGCAGGA 
CAATATTAGA 
AATTCGAAGT 
ATATTTCTTT 
GCATATTTTT 
TGAATTAATA 
TTAGAAATTC 
AAACTAAAAA 
AATCGTTCAA 
CTTTCAGTAA 
AGAATAAAAG 
TTTTCAAATC 
ACTCCAAAAT 



.T TAT 



865 

ATCTAATCAT ^ATAAACTTA GTGGGATTAC 
AATTTTAGCT GGACAATCAG ATTGGATACC 
TCAGCCCAAT TCATGGTTTC CTGTAATTGA 
TACGGGTATT ATTGCTGCTA TTTTTTCTGT 
TATGGCAATT AAGCTTCCAG AGTCTGTTCC 
AATTCCTGTT GTTG€GCTTT CAATTGTAGC 
TTTAGGAAGC CTTTTTCCCG AAATAATTAT 
CGATACTTTA GTTGGGACTT TAACAATTTC 
TCTTCATGGT ACCAATGTTA TTATTGCTCT 
TTCTAATATT AGGGCTCTTT CTGACAATCT 
TCTTGATTCA TTTGTGTATA TTGGTGGTGC 
GATGCTTAGT AAATCCCAAC ATCTA/^GGC 
TTTTAATATT AATGAACCTA TTATGTTCGG 
CATTCCTTTT TTACTTATCC CTATATTTAA 
TGGAATTATT GAAAGGGTTA GAACTCTGGT 
TTTTTTTTCT ACAGGGCTTG ATATTAAATC 
TTCAGTATTT ATGTATTTAC CCTTTATTAA 
AAAAGAATAG GAAATTTTTT TAGAATTGCT 
GAGCTATTTA TAAATAGCTC TTTTTTTGGG 
TTATTATTTT ATGATTTAAA TTAAT7UVAAA 
GGTTTATTAT GCATCCTAGT ACATATTATA 
TTAAAATCAG AAATTTTTTA CTTAGCTAAA 
TGCCTCCAAA AGTGAAGATA AAAAATGATT 
TATATAAAAA ATATCTCAAT AACGAGCTTT 
TTCTTGCAGA GAATCACAAA GCTATTCTTT 
TAATTTTAAA TCTTTCAAAG ACTCGTAAAA 
TTGAAAGGAT TAGAA<3AGAT AATACTTTTT 
AATTAAAAAA TATAGGAATT AAAGATCGAA 
AAATGAATGA TGAGAAGTCC TATTTTCAAT 
GGTTAAATGA TTATGCTCAT AAATATAAAA 



AGGAGGATTT 
TTACGGTGGA 
TGCAAGATAT 
TGAGGTTTAT 
GCCTGCTGTT 
TCAAAGTGTT 
GAGCATGTTT 
TTTTATTGTT 
TCTTAATCCT 
TCCACTTCCT 
TGGCGCAACC 
TATAGGTAGA 
TGCACCAATA 
TATAATTGTT 
TCCATGGACA 
GTTTGTTCTA 
AGCGTATGAT 
ATTGCAAAAC 
AGATAAAAGA 
GATTTATCGG 
TAATTTAATT 
GATTTTAAAC 
TTGAAATATT 
CATATTTAAA 
TTAGAAAAGA 
TAATTAAAGA 
TATTTTTTTG 
AAAAAATAGA 
ATTTTATAGA 
TTGAAAAAAT 
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TTATCTCTTT 
GATGCTGCTA 
TTTAGTGCTC 
AAATTTTTAG 
TTAAAATCTT 
AATATTGCTA 
AGGCCTGTTT 
CATATATTAT 
ATAATTTTGT 
CATATTTTAG 
CTAGGGCTTG 
CTTTCATTTG 
GTTTTAAATC 
GCATATACTC 
ACCCCTGCTC 
GTTTTATTAT 
AAGGCTCTAC 
TTGTGATACA 
ATTTATTTAA 
TGTGAATAGA 
TAATATATAA 
TTGGTATAAT 
TAGAAAAGAA 
ATTGAAAGAA 
TAAATTTACA 
ATATATTAAT 
GAAATCAAGA 
AGAGTTGATA 
TTTGTTTGTA 
TAATAGTTAT 



23100 
23160 
23220 
23280 
23340 
23400 
23460 
23520 
23580 
23640 
23700 
23760 
23820 
23880 
23940 
24000 
24060 
24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
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AGGAAAGAGC AGATATTTGT TAAAATTAAT 
CTACTGAATC AAAGTCGAGA TATTAGATTA 
CGTCGTCCTG TTGAAGTAAT GAAGCTTTCA 
CGTATGGAGT TTATTGCAAA AAAGCGAGAA 
GTTTTTGCAG ATCCTGAATT AATAATTAAT 
ACTGAGAATC TTACTAAAGA GATAATCTCT 
TTTCGTCAAA TTTTTAATAA TATTTTTGCT 
ATTTATTGTA AATTTOCTTA TCTTGCATTT 
ATAACAAAAG TTTTGGGGCA CGAGCCAAAT 
TATGTTTTAG ATAATTTAGA CGATAAGGCA 
AGAATTTATA CATATGTTAG ACGTAAAGCT 
GAAAGTTTGA TAAAAGAACA TCATATATTT 
ATTAAAAATT TGATGTTAAA GGATAATTTA 
GTTAAAATTC GCAAAGCTTT TAAAGCCACA 
ACAGAATACT TATCAATAAT TTTTAATTAT 
GCATTATCAA TATATTTGGG AAATATTAGG 
TTGTATGAAA ATAGGTCCTC ATTATTTTTT 
AACGATTTAC ATTTCTTATC TTTATGATAG 
GCTTAGAATT TATTTTAAAG ACTCCAAAAG 
GAATAGTTCA AATGGTAGTT TTATTTCGTQ 
GCTTGATATT AAATTCTCTG ATGGCAATTT 
AGAGTTTTTG AAATTTAAAG TCGAACATTT 
TAACAATTCT TATGTGCACA ATATTAAACC 
AGAGGCAAGC CCTAATAATA AATTTTAAAA 
AAAACTATTT TTTCAATGTT TTTAATGTTT 
AATTTTTTCA TTTGTTCTTT AGTATTAAAG 
AGATTTTTTA CAAATCCTTT TAGTTTCATA 
AAACCAACAC CTTGCACCTT GCCAGAAATA 
TTTGTATAAA ATCTATCCAr TAGAAAAGTT 
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TTAAATACCT ATATTGAAAT AATTAAGCTT 24900 

AAATTTTATG GAGTTTTAAT GGCAATAGGA 24960 

CAATTTTATA TCGCAGATAA AAATCATATT 25020 

AATAATATTG TTAATGAAGT TGTTTTTCCA 25080 

TCCATAAAAG AAATACGCTA TATGGAGCAG 25140 

TCTAATCTTG CATACAGTTA TAATAGATTG 25200 

CCTGAAGAGT CTGTCTATTT TTGCAGAGCA 25260 

GCGCCTAA7UV ACATGGAAAT GAATTATTGG 25320 

GACATAACAA CGGCCTTTCA TTATAATCGG 25380 

GATAATAGCT TATTAACATT GCTTAATCAA 25440 

ACTTATTCTA CTCTTACAAT GGATCGTTTA 25500 

GATGATAATT ATATTAAAAC GTTGATTGTA 25560 

GAAACTTTGG CAATGGTTAG AGGATTGAAT 25620 

TATGGATACA ATTATAACTA TATAAAACTT 25680 

AAGCTATAGT TTTTGTTTTT TTAAATTCAG 25740 

AAATATTTTA TTAATAAGAT ATTATATAAT 25800 

TAAAAAAATT TTAAAATCTA ATGACAATAG 25860 

ATTGGCTTCA GTTAAGCCAG CAGGAGAATG 25920 

AGGTAAAAAA TATTTTATTC TTTTTAATAG 25980 

CAG7TTTTTA AAAACAAGTT.GTAATTGTGG 26040 

GAATATTTTT TGTAGAAACA GAAAGTCTTT 26100 

TTTTAGAACT AGTGTGTCTT GCTATAAGAA 26160 

AAAAAATAAG GTTAAGGTAC TTGTTAAACG 2 6220 

TCATTAAATT GAAAAGGATA ATTTTCATCT 26280 

GAATACTTAT TCCCATTTAA TAATTTTTCA 26340 

AAAGCTACAA TTTCTACCCT TCCATCGTTG 2 6400 

TTATTTGCTA TTTGCTCTGT GAAAAATCTA 26460 

AAATATTGTT GTTTATACAT TATTACCTTC 265i0 

TTAAAATTTT TCTATTGGAT TAGCTGTTTT 26580 
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TATATTATAT TTTAAAAA' 




I 867 i 

'ACATAAGC TTGTCGATTT CCATTTTTA'T 




'AtCGGAC 



26640 



AATCCTCCAA ATACAATTTG AACACTATTT CCTTTTTTTA ATATTCCACT 



GGCACCTAGA 



26700 



TTTTTGAAAT AGGCGTCTGA TTTAATGACT TCTATTTGTT TTAGATTGAC 



TCTTAATCTT 



26760 



GATGCACATG CATCAATGTA TGTAATATTA TCTTTTCCTC CAAGACCCTC 



T 



26811 



(2) INFORldATION FOR SEQ ID NO: 7: 

... (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 26782 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7: 

GCATTTATAT CTCTATCATG CAAAGTGTTA CAACTACTAC AAGTCCACTT AGCATCACTT 60 

AATCTTAGAG TCGTATTTTT AATGTGACAA CTACTGCATA GTTTACTTGA TGGAAAATCT 120 

CTATCTACTT TATACAAAGA GGATCCATAC CACTCTGATT TGTATGATAA TTGTCTTACA 180 

AACTCAGACC ATCCTAAATC ATTAATACTT TTTCCAAACA TTCCTTTTTG CATGCCTTTA 240 

ATTGATAAAT TTTCTATTAC TATGTTTTTA TAATTGGATA CAAAGTAATA AGATAATTTA 300 

TGCAAAAAGT CTTTTCTTTG ATTTGAAATT TTCTTATGCA GCTTAGCAAC TCTTAATCTA . 360 

GATTTAGCCC TATTAATAGA ACCTTTTTGC TTTTTTGATA GTTTTCTTTG ATATTTTTTA 420 

AGTTTATTTT CATTTTTTAA TAAATATTTA GGATGATTGA TTTTCTCACC CCCACTACTT 480 

ACTAAAAAGT GTTTCATACT CATATCAATA CCAACTATCT CTTCTTTATC ACCTTTAGTT 540 

TCATTGTTAT TTTTAGTATC TAAGCACTCA ACTGTTATTG AAATATGATA TTTATCATCA 600 

GTATCTTTTT CTACTACTAC ATTTTTAACA AGCTCATTAT CTTTAATGCA CCTATGTAGA 6 60 

CACAACTTTA TAAACCCTAT TTTAGGTAGT TTTTATAACC ATTTTCTATT CTTATTGAGT 720 

TTTTTTGATT ATTAGTTCTA TAAGTTTGCC TATTTTTCTT ACTTTTATAT TTAGGAAATC 780 
CTTGCATTTT ATTTCCTTTT TTAATTTCTC TAAAAAAATT ACTATACGCA AAATTTAAGT ' 840 

CGATCCACGC ACTACAAAGA GCCAAACTAT CAACTTCCTT TAAAAAAGGA AATTCTTCTT 900 

TATATTTACT TGGATAGGTA ATAAGATTTT GTCCATTATT TTTATAATAA TCTTTCTTAT 960 

CACTTAACAT TTTGTTATAC AAAAATCTTA CACATCCAAA TACTTTTGAA AAATATTTTT 1020 

TTTGATTGGT GTTGGGATAT ATTCTGCACT TATAAGCTTT ATTAGCACTC ATTATTTTTT 1080 

ATAATTATAA TATTATATTT TAACTTGCGT TATAAATTCA TCTCCACCTA AATATGAAAA 1140 

AATTCATAAA AATTAAATAT TGAGAGTTAG GCAAATTATA ATTTTATCTA AAAATAACAA 1200 
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AGAATACTCC ACCTACAATT TCTATGAAAA AAGTATTTAC TTTTCTGAAA AAATTGTGCA 1260 

TTATATATAA TATAAATCCC ATAAGGAGTT CAACAATGAT TAATAATTCA AAAAAGCCAA 1320 

ATTGTCACAA CAAGTTACAA CAAAAATTAA TAGTTCTTCT TTCAACACTT GCATACGTAA 1380 

ACAGCAAATA TAATAAATAT ACCCAAAAAA ACATACTCTA TTGCTTTAAT GAAAACCTAA 1440 

AAAGAAATGG ACAACCTACC ACTACACTAA GAACAATGCA AAATTATCTT TATAAATTAG 1500 

AAAAAGTATT TAAAGTAACA ACTAACTACT ACAAACACTT AGGGATAAAT TTCGGAACTG 1560 

AAATTTACTA TAAGCTAAAT TATTCTAAAA AAGAGTGTTA TCTTAAAATC AATCAACATT 1620 

TTAGAGAAAA AAAAGACTAT AGGTTTAAAG CTAGAGTTGA TAACTATCTT AACGACAAAT 1680 

TTAATAAAAA TGGGAGTGTA GATTTAGTGG AGTGTTTAAA TAATAAAAAT AATAATATAA 1740 

AAGAAGAAAG AAAGATTATA CAAATAGAAA AGTATCAAGT AATAAAATAC TfCAATAAAT 1800 

GCAACTTTTC TTTATTAAAA GAAATTCTTC CAATTTTAAA TTTGGATATT AATAAAGATG 1860 

AATTGATTAA AATACTCAAA ATTATAAAAA GAATTGAAAT CAACCTAACA AAAAATAAAA 1920 

ATACATATTT AAATGTGTCT TATTTTAAAG AAAAGCAAAA CAAATTAAAG AAAATATTAA 1980 

GCAACACTCA ACAACAATTA GAAAAAAATG GATATAATCC TGAGCAATTA GAAATAAGTT 2040 

TCCAAAAAAT ATATGAAAAT TACAAAACTA AACCCCATTT TATCATTGAA AATCATAAAT 2100 

ATAAAGATTT AAGCCATATA AAACGCAAAT TAGAAAAATC AATTGAAAGA AAAAAAGAAA 2160 . 

ACTTACAAAA AGATTGCGAA AATATGAGGA CAAACATTTT CAATATACTC ATTGAACAAC 2220 

TAAAAAAAGA AGTAAAAATT GACGTTTTAA AACCAATTTT AAAAATCTAT TTGAATAGCA 2280 

AAAATAAATT AGAATATAAT AAAGTATTTA ATAATAATTA TTATTATGAA TTATTAGAAA 2340 

TAATMAAkh ©GAAAAAAAT CTTCAGTTi^^ AAGAAGTTGT ATAAGAArTTA AATATGCAAA . . 240.0 

ACATGGCAAA ATCCATACAA TTAGTT7VAAC CAATAGTTAG ATGTTCAAAT AAAAAAGATC 2460 

TTTTTATTAA GATTGAAAAA GATAATGATA AAACAATATA TCACACAAAA ATAATGATGG 2520 

ATATTTATAA ATTTGGACTT AATAAGAAAA AAAATAAATA TCGTATATCA TTAAGAGGAT 2580 

TATTTAATCA ATCAAAAGTT GAAGAATTTA ATTTATTTAC ATTAAGAGCA GATGATAAAT 2640 

TTTTAGGCAT TTATTACGGG TATAAAAAAC GAATAAAGAA AATTTTTGTG AAGTACCAAG 2700 

TTGGCGGAAT TGAAAAATCT TATTCTTTGT CAAAGACATA TTACATGGAG GTTAGATTTA 2760 

AAAAGGGAAG TATTTTTTGC TACTTTAAGA GCTTACCCAG GATACTAAAA AAAGAAAATG 2820 

TTAATACGAC CTACAATAAA GCATTATTTA GTATGTTTAC GACATfTAGAA AGQCAAGTAT 2880 

ATGATTTTTA TGATAAAAAA TACCCACAAA AAGGACCTTT TATAAAATGG ATAGAAAAAA 2940 
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A 869 

PA TTATAGCTAT TGCTTCAATT AAGGGAGGAG TTC 



GTTGGCTAAA AAACCACATA TTATAGCTAT TGCTTCAATT AAGGGAGGAG TTGGTAAAAG 3000 

CACTTCTTCG ATAATGTTTT CAACAATTCT TAGCAAAACT AATAAAGTGC TACTTGTGGA 3060 

CCTTGATCCA CAAAACGCAG TTACAAGTTA TTTTATAACT CAAGATCATC CGAGi\ATGGA 3120 

.ATTAATTAAC ATTTATAATT CTTATTCTTT AATAAAGAAA CATAAAACTT TTAAGGATGT 3180 

TGTTATTAGT ATATCTAAAA ATTTGGACTT TATTCCAAGT TATCTAGAGC TTGCTAAATT 3240 

TAGCAAAGAA GGAAATCAAT TTAAAGAACT CATGCTTAGA AATGCAGTAT ATAATTATTT 3300 

AGAAGATTAT GATTACGTGA TAATTGATAC TCCCCCAAGT TTATCGTCAG AGCTTGACAA 3360 

TGCTCTTGTG ATTGCAGATA AAGTTATAAT ACCGGTTCCA CTTGAAAGGT GGGCAGTTGA 3420 

AAATTTGCCA TTACTAATAA ATCAGATAAA AGAATTAGAA AATAATTTTA TGGGGAAAGA 3480 

GGCCAAAATT ATTCATATTT. TTGCATCTAA GGTTGAAATA GGAAGGGTTA CTTCAACTGA 3540 

AATTATGTCT TTATTAAAAG AAAAATATTT AAATAAGTTT ATTGGAGAAG TTCACAAAAG 3600 

CGAAGCTTTG AAAAAGATAA TAGATTATGC TATAGGGCCA AAAGAAAACG AAAATTACTA 3660 

CAAAGAATAT TTAAGAATTT TAGAAAAAAT TTAGCATGAT TTTTTTTAAA AAAAGTCCAG 3720 

GCACTGGACT TTTTTAGAGA GGAGTTTAAA AAATGGTAAA AAATAGAAAA GTAATAATAA 3780 

ATGATAGGAT TGTAAGAAAT GCTACTTATA TTAATACTGA AGAACGAGAC AAAAAAGAGT 3840 

ATGAACTTTT AAAAAATGAA CTTAAAAATA GAATAGAAGA TGATATTAGA AATAAAATAA 3900 

ATACAATGAA AATTTTACTA GAAATTAGAA ATAGAAAACT TTATATTTTA GATGGATATA 3960 

AAAAGTTTGA AGATTTTATT TTTGACTTTA AAATAGCCAG AACTCAGGCG TATAAGTATA 4020 

TTAAAATAGC AAAACTTATT TTTGAAGGAA AGCTTGAAGA AATTGATATT ATAGAAAATG 4080 

GGATTGATAA AACTTTATTT AATTTGATGA AAGATAAAAA AATTAACTCT AAAGCAAATT 4140 

TAATAACACC ACTTAGGGTT AGGCTAGAAA CACAAGAGGC ATGCGATTTT TACAAAATGA 4200 

ATCCAAAGTT TGCTAATTAT ATTCTTGAAG ATTTTTATCA AAAAAACAAA 6AACAGCTTA 4260 

TTAAAAAATT AGAAGAATAT AAAAATAAAC AAAAATACTC TTAGTATATT TAAGCAAACT 4320 

TTTACTTATA TAGAATTTTT ATTCTAATAG CAGAGTAAAA GAAAAAGACC ATTAGCAAAA 4380 

GCTAAAGGTC TTTTTCAAGG TATTGATAGT TACATAATAA ATTATGAACT ATCAATATCA 4440 

ATATTATATA CTAAAAAAGA TAAAATATCA AGAAATTTGA AAATTTTTTC ATATTTTTCT 4500 

ACTCTGCCAT TCTGAATCCC ATTAAATGTT CTTTTGATTT TAGCATTCTA ACTAATTTCT 4560 

CAGCATCAAG CACATCTCCA TTAAAGTTAT AGTAAAAATT ATTTACAACT GTACTGCTTT 4620 

GAGTTTTTTG TAATTTAGTA ATTTCTTCTG CAATAATTTT AGCTTCAAGT TTGCGTAGAT 4680 

TTTCATCTAT TGGTGCTGGA GTTATTCTTA CTAATTCTGG TTGACCAAAC TCACTAGACA 4740 
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TTACACCTGA GTTTGGCATA TATGTCGGTT TATTTGAAAC AAATCGTGCA CCGCCATGAG 4800 

CAAGTTTTAT CTCTTCAATA GATCCAGCTG ATTTTACTTT TGCAATTCTT TTTAGTATTT 4860 

CGTCTAAAAT TTTTTGTGTT TTTCTTAACC TATCAGGCTT GCCCAAATTC CACCAATCTT 4920 

CAGCATTTAC CTTATCAACT TCGGCCTGTG CTTTTATTCG TTCGGGCTCT AGTTTAGAAA 4980 

GTTTGTTTTT GCGTTCTACT TCTAGTTTTT TAGCCTCTTC GGTCTTAGTA AGTTGGGTGG 5040 

TTTCTATATC TTTTTTTGTT TTATATTCTG TTTGTACATC GTGTAATCTT TTTTGAAATT 5100 

CTTCACCAGA TATTTGTCCT TTACTTTGAG CTTGTTTGAG AAATTCTATT TCTTTAGTGT 5160 

ATTCATCATC TAATTCGCTC AATTTTTCTT TTCTCATTTT GATTTCTTCA TCAAAACGAT 5220 

CTTCAAGCTT TTTAAGTTCG ACTTCACTTC GTTTTTCAAG TTCTTCCAAA TCTTCGTCCC 5280 

GTTTTTTTTC AATTGCTTTA ATTCTCGCTT TTTCTTGCCC CTTCAAAATT CCCCAAACAA 5340 

AATCGGTCAA TCCGTTTATA AGCTCCGCAA CAGCTTCTCC CCAAGGTCCA AAAACTGCTC 5400 

CAGCAGCAGT TTTTAATCCA GTTTTCCAAG ATTCGTACAT TTGTGTTGTC ATTTTTTCCA 5460 

GACCTTCACC CCAATTCACA TCCTTCCCAT TAATCAAATT ATGAAATTCT TCTCCAATAC 5520 

TTTCTCCCGT ATCCTTATTC AAAAATTTGC CCGCTATATC TTTCATAAAG GCATTCTTAA 5580 

AGACATTTAG GCCGTCTATC ATGCTGTCAT ATAAGCTTTT TGTCGTATCT TGAGCTTTCT 5640 

CAGCATATTG TTTTATAGTG TTTCTATTGG TTTCATTTAG CTTTTTAAAT TGCGATTTGT 5700 

GCTCATCCAC GAATTTTTTA TACATTGCTT GAATTTTGGA TGCCATCTTT TTTTCAGCAC 5760 

TTGCTCTTTC TTTTGCTGGA AGTAGGATTG TTTCCCACTC TAAGTCGGTT ATTTCTTTTT 5820 

GCAGAGCTTT TTGAGCCTCG ACAAAAGATC GATCTAAAGC GGTTTTTTCA TATTCATTAA 5880 
CCTGCTTXTQ AAGTGCGACT ACAACTTCCC TGTTAGACTC . GTTCAQAGTT TCGAAACTTT - - .-..,5940 

TTCCATATTT TTCTACGAAC GCTTTGTTCT TTTCATTGAT TTCATCATTA AGTTTCTGTA 6000 

AAGCGCTTAC TTgATCTGTA TGGGGCAGAG TTTTGATTAT TTCCCTTTCA CGACTTTCTT 6060 

TTTCTTTTAG TAAATTTTGG TACTCATTCA CAAAATCATA ATTGGAGTTA TTGAACTCAT 6120 

TTACTGATTT TTGAACTCCG ACTAAAATTT TCTTGTTCTC GTCAGTTAAC T6ATCAAATA 6180 

TTTTGGAGTA TTCATCCTTA AACTTTTGGT TTTTTTCATT TATGGTTTTT TCAAGATTCC 6240 

TTAAGGCTTG TTCTCGTGCT TTCCCGGTCT TATTATAGAT GTCCCTCTGC CTATTAAATA 6300 

TTTCGTCTTG CAGCTTTTGA TAGTCTTCTG CCATTTTCTT GTTAATATTG GTTTTTGCAT 63 60 

TTGGATCAAA CTTTTTATCC CTOyfcGGGTT CGGAACCAGA AGTGTCTTTT TCCTTTTCGG 6420 

CTTTTTTCCA AAAAGTAACC AGATTTTTCA ATTTTGTATA CGCTTTGGAT ATCATATCTA 6480 
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rT<^[TAATGGGCT CAAACGCACC CTTAAAACGA^C: 



TCAACTTTTG AACCCATTT^TTtAATGGGCT CAAACGCACC CTTAAAACG^^TCTAAAAATC 6540 

CACTAGAAAC ATATGTTGCA AGTTCTTTTA GCTTGCCGAT TACGTATTTG ATTCCCTCGT 6600 

AGAGCTTAAC AAAGGGCGTG GTAATGGCCT TGAACAACAT TTTCATGCCT TGCACCCACT 6660 

TGCCGGCAAG ATATGCTACA AGCTCACCCA ATTTGGTAGT TAAGTATATT GTAGCTGTAG 6720 

TCACCTTGGT CAAAGGAACC ATGATTGCTA CCATAAGAAA TTGTTTTACT TTTTCAAATC 6780 

CAATCATCAT TGGCTCTAGA GCTTTTCCAA TGTCTAAGAA AAGCTTTTCG CTCATTTTGG 6840 

CAGTTTGTTG TTGAGCTTGA GCTAAAGTTT TTGCTTCTTT GGCGGTGTTC CCATAAAATT 6900 

TACCACCTTC GCTAGTGGCT TTGGAAAGAG CTTTATTTAG GGCGTCGAAT CCTATTTTTC 6960 

CATCGCTCGC TGCCTTATAT AATGCCTCTC CAGCTAAACC AGCTTCTTCT GCCAAAATGT 7020 

CTGTAATGTC AACACCCGCG TCACGAAGTG CATACAAATC TTCTAAATTC ACTTGATTGC 7080 

TCGATTCTAQ ACGAGAATAT ACTTCGGCTA ATTTCTCAAG CCCCTCGCTA CTTCCACCAG 7140 

CAGCCTCCCC AAACATTCTA ATTCTCTCTT CAACTTCACT CGCAGTTGCA CCATAAGAAA 7200 

GCATTGTTTT AGTAGCATTA GCAATAGCGT CTCTAGTAAA AAGAGTTTCA TCGCCAAAAG 72 60 

CCCTCATGGA TTCTGCTAAA GATTTTCCAA GGTCTTCGTT TCCAAGCATG TCAGAAAACG 7320 

TTGACACTTC TTCGTTGAAT TCATCAAGAG CATCCATAGC GCCATCAAAA ATTCCACTTA 7380 

TTGTAGAGCC GATTGCTTGT ATAGCCTTTA CAGCCATAAT AATTGGGGCA AAAGCCGCCA 7440 

ACATTTGGTT GAATGCCTCA CCAGTTTTGT TTGCCAAATT CTTTACACTT CCTAAGCCTT 7500 

TTCCAACACT TTTTAGAACT TTGCCTATAC TTTTCATGCT GGCAGCTTTG GAATTTACGG 7560 

AATTAACAGA ATTTGCAAGA GATTTGAAGT TTTTAATAGC ATTCTGCGAA CTTTTGTTTA 7620 

GCGCTTTCTC TAAGTTGGAT CCAGATTTAG CAGATTTTTC TAATTTTGAC TTCAAATCAT 7680 

CCAGACTTGA AAATTTTTGT TCGGCAATTT TTTTTAGAGT TTCTGCTATT GCGTCCAGCT 7740 

TTTGATTATT GCTGATCGAC ATTGATAGCG GAATTATTAT TTCATCAAGT TTCATCTACT 7800 

TCTGCTCTCG CTCTCAAGAT TTTTGATGTA CAAATTGAGT TCGTTCAAAA CCAAAACAAA 7860 

CCAGTAATTT TGCTCAAAAA GGCCGCCCCT ATTAGGCAAG CTGCCAATAC TTTTTGAAAG 7920 

TAAGGCTTGA TTTAGTAAAT GCAGAATAGC ATCCTCATTA TATTTGATCC AGGGAAGTTC 7980 

CTTTTTCATA TTCACTATGA ATTCTGAATT CACGCGATCT GCAAAATTCA GAATTTGGTC 8040 

ATAGTGATTT TTTTTTGTAA TATAAGAGAA TGCAAGCTCT ACTTTTTTGA AACACGCTCA 8100 

ACCCTTAGAG TA^CTGCCAG AAAATTAATT TCGATTGCAA GACTTGAAAG CATGTCTTGA 8160 

AACAAGATAG CGTCACCTTC AACCATCTCT TTGGTGATAA CCTCTCCTTG TTGATTTTCA 8220 

AGACCGACGA ATCCTACCAC ATTTTCATCC CAAATTTTTT TTACAAATTG AATTTGAGCG 8280 



wo 98/58943 
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CTTGTTGACT CAATCATAGC 
AAAAGTTCGA TTTGTCTTGC 
ACCACATATG CTTTCTCTTC 
ATATAGGGTA ACATTACCCT 
ATCTTGAAGA ACCTTGCATC 
AGAGTAAGCT GGCACTTTAG 
GTTGCAATTT GTCCTTCGCC 
TCTACAAAAA GTACCGTGAA 
TGGTCATTAT TTTTTGAAAT 
AGGATTTCTT CCTTATTAGT 
TGCTCTGGTA TTTTTCCAAT 
GCTTTTGTTG AGCTGATGGT 
TCAATTTCAT CAGCATTATC 
TAGAAAATAC TACCTTCTTT 
rpTTTTAACCC TAAAAATGCA 
GAGCCCAAAT CTTTTACAAC 
TTAATGTCTG AACCCTTGAA 
GCGCCAGTCG GCATTCTCAA 
ATCAGCGCCA TCTATCCTAA 
AGAATTTTCG TCTTCAACCT 
CATTAGAAAC GCCACAATTA 
CTCTGTGTAA ATTATGAACT 
AATTTCTCCA GTACTTTTTA 
AAACATTTCA GACTTGTAAT 
TTTCAAATTC TTTTTCAGAT 
GCAGACTCCT TTACTAAATC 
TTCAAAGATA GCCAAATGGG 
TTGATTTTTG TTAGACTTGG 
AATTCAGAAA GAGGGGAGCC 



^ 872 

ATTGGAATTG GTTTTACCAT 
CTTTAGATTT TCCACAAACC 
TTCTTTGATC TTTTCCTTGC 
GCCAGTCAAA TTAACATTAA 
TTTAATATAG TCGCATGAAA 
ATCGATTTTT TGATTGTTCA 
CACCATGAAT TTGGTTCTTT 
CTCGTAATTT GTAGGCAAAC 
ATCTTGTGTT ATGAAATGCG 
TGCGGTTTCT CTAACGGAGT 
TGCCGAGATT GATCCGCAAG 
ATATGAATAC CCTAAGCAAT 
ACATGCAGTA GATATTTTTG 
TAGATCTAAA TCTGATGTAA 
TTCGCTAATT GACTTCCATT 
TAAATTAGTA GGATCTGTTC 
ATTCCACTTG AATTTTTCAA 
TTTTTCAATT GCCATTTTTA 
TTCCCAATGT TGAATCAACC 
GGGAATCGTC AATGCTAAAA 
TATTTGCAAT CTCAAGCCCT 
TTGGACACAA AAGCATCGAG 
CTGCAAAGAC AATTGATGGC 
ATACTTTTGT GGTTGTTTGT 
TAATGACAAA TTCTTCTATG 
GCTTGTCCAG TTTGTATATT 
TACTGCTGAG GATTCTATAC 
AGCTGGCAAG TTGTTGTTAT 
TACCTTTACT TTTAAATTAA 
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TCTCGCCATT CAATTTTTTG 8340 

CATAGTTAAT GTCTTTCAAA 8400 

CGTTTCTAAT ATAGTCTGGG 8460 

TTACCATTGT TGCCTCCTAA 8520 

GGGATACTAA GGGTTTTGTC 8580 

AGTCCTGGCT TGGGTTGTAA 8640 

GATCTTGATC TGCAATTTGA 8700 

TGCGTTTTCC AATTTGCCAT 8760 

ATTTTTCTAT ATATGTATCT 8820 

ACCCGCTAAA CTCAACAGTT 8880 

TTGTTTTTAG AGTTTCTGTA 8940 

ATGTTTTGAA AAGTAGAACA 9000 

TCAAAAGATC TTTGTTATAG 9060 

GTTTTGACTT AGAATCAATC 9120 

TGGTAGGCTT TGTTATGTTT 9180 

CAGAAGGTTC ATTATTATTT 9240 

TATTGACCGT AACTAGCACT 9300 

CCTCCACGAC AATTAATGTA 93 60. 

AATGTTACCA TTCTTGCATC 9420 

TACTTCAACG AATAATTTAG . 9480 

AAAGTAGGAC GCATGCTACA 9540 

TAATTTTTGC AATGATTCAG 9600 

AAGTCTAAGT TTGAACATGC 9660 

TTACAAGTAG CCAAGTAAGT 9720 

TGCTTCATCT AAGTAATTTT 9780 

GGTTTTTAGG TTTTCTCTTC 9840 

CCTTATATGC TGCCCAACTT 9900 

ATGCCTGTCC TGAGTCTAGA 996.0 

TTCCCAAAGA AGTTTCTTCT 10020 
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aaatcaatat 
ttttgtcgga 
ttttctccaa 
tcaatacgag 
tgatctcctt 
agccaattat 
agtActtcaa 
gtgcactcaa 
agttcactca 

TCTTGTGGTT 
TCTGATGATG 
GGATTTGGTT 
TGATCTCTAA 
AAAAGGTGAG 
TGTTTTTCTG 
AGTGTTTCAA 
TTTTTTTTAC 
GCCTTTACTT 
ACTGTATCAA 
ATTTCATTGC 
ACAATATAAT 
GAAAGGCCAC 
AAAATACTTC 
TTTTCTGTTA 
GCTATTTGCA 
TTTTACAAGT 
GTTATCTAAC 
GTAATTTTCA 
ACCAACTCCC 
ACTTGAATAA 
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TTGTTACAT'^^ACAATCGT CCGGGGATAT 
TTTTAAAACC AACGAAACTT TTTGCATTAT 
TTTCCATTTG TTATCCTTTT GGTCAACCAA 
GGAATAGGAA ATCAAGTTGA GAGAGCAAGT 
TACACCTAAT ATTGAAAACT TCTAAATAAA 
TGTAAGCAAC TCCCATTTGG TACAAGGCCA 
AAAGTTGCAC TTTTGTTTGA TCTGGGATAC 
TTCGTAAAGA TTCTATCTTA GTAAGATTGA 
TTTGCTAAGT TTGTTACCCA TTAGGTTTTG 
GAAAGTGAAT TATTCCTGCT GATTCCATTG 
CAAATTTTCT AAAGAATATT TCTGACAACA 
GATAAAGTAT AGGATTTTTC AATCCTTTGA 
AAAGTGCTTC TTTAACTGTT ACATACTGAG 
AAAAATTGTG AGGAACTAAA AGATGGTAAC 
CTTCACGTTT TGCAAGTGCT ACTTTTTCAT 
CAGTAACTTT ACTTCTGCCC TTTAGATTTG 
CAAAAATAAC AGAATGGTAT GCATCCTTCA 
CGTCTTCGGT TATAGTTCCG TACATTAGGT 
ATACGTGCAT CTTGTAAGCC ATTTCTTTGA 
TATGATCACC AAAAGTTGCT GTGACATTGT 
AACCTTGTCT TAGATCATTT CTACTTATCA 
CTTTTGCAAG TTGTATTATA TCTGCACTGT 
TACTCAAGAA CTACCTCCTA TTTTTTCACA 
CCATTAGACT CAAACTCAGG GCCAATATTA 
TCAAGACTAA CATCTTTGAT TCTCCCAACT 
TTCCCCCCCT TTAAGAAGAC AAAATCACCA 
ATAACGGTTA TTTCCCCGGC ACGTCTTATT 
CTTTCTAGTA AAGCAATATC TGCCTTTTTT 
GCTGTTGCAG TTGCAGCCTT TACCAGTACT 
ACTGGATCTC CCGGTTTGAT GATGGGTGAT 



Jl 

rAJ^GAC 



GTGATTTTA3^<3AGTCCGAC 
CAAATATAGA TTTTCTTATT 
TATAAAGAAA GGGACAAGAA 
ACTTAAATTT ACACTCTTTT 
GAACATCAAG CAAAATTACA 
AAATAGATTT TGCATATCTT 
TAATGTTTCC GTCTTCATTA 
TCCACATAAT AAGATCGTCA 
TAACTTCAAT TTCAATAACT 
AGGCATGAAT GTAATCTCCG 
TTGGAACAAA CATAACTTCT 
AAACCGAAGT TACCACTTTA 
GTTCGCTGTA TAACTCTAAT 
CCTCATCAAG TTTTTCCATG 
ACAACGTATA TCCATTAGTA 
CAATGCCTTC CATATTGATG 
TAAGGCCAAG CTCTAGATTA 
CTTTTAGAGA AATTCGCTGT 
AGAA/^TACT ACTTTTTCCA 
GGTCAACTGT TGCTTTTTTG 
TCTTGTAAGG TACAAGCTCG 
AACTACCACT TGCTTCTGCA 
AATTTTTACG TTCATGCAAA 
ACATCAAGCA AAACTACTTT 
TGCACACCCC CTTTGCCGTC 
ATTTTAGGAG TTGCAAATGT 
GGAATTAGTT CGCCCGGTGA 
AAGGCAAATC CACGAATAGG 
TCTCCCATTT CACTTGATCC 
TCAACATCAA CTATTGCGGT 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
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TTCAGTTTGA TGTACGCATG CTTTGTGTTC AACTCCTAAA ACGAAATTTT TACATAATTT 11880 

TGTAAAATCG AAATCTGCCA TTTATGCCCT CCCCAAAGCA AATCTATCTT TGTATTTTTG 11940 

TAATTTTGTC TCGTTAATAA TTTGACCTGT AAATCGATTT CTTGCATTTA CCATTTGCTT 12000 

GTACGCTGTAT AGTTCTTGTA CTAGCAAGCT GATATTGTCG ATTTGCGAAT CAAGGTCACC 12060 

TTCCTCGTCA ATTTTGAACT TGATGTTGTA CTTTTTTTTC ATTGCATCCA AAAATGCAAG . 12120 

CTTAGCGTCT TTTACGCTCA GAACATTAGC AAAAGGTGGA GCAATTTCAT ACTGCTCACA 12180 

AGCTTTCTCA AGATTTGACA AAATTTTAGA ATCTTTGAAA GCATTAGCTT CGGCTTGCCT 12240 

TTCGGCTTGT TTTCGAGCTT TTATAAAGTT GCTCTCAGCC TCAGCAAGTC GTTTTTCGAA 12300 

ATCTTCTCGT GATATCATGT CTGGCAATTT TTTTGCATCA GCCACTAATC GTTCATATTC 12360 

TTCTGAAGAT ATTGTTACAA GTTCTTTGTC ATTTTTTGGC AAAGATTCAG AAATTGCAAC 12420 

AGTTTCTTCA TTTATTTGTT CTTGCATATT GACCTCCTTA AAATTAAATT TTCTAAATTT 12480 

GCAAGTACTG ATTCATTTCA TCTTGTATTT TTAAATACAA GCTATCATTT CCCATTTCTT 12540 

TCGCCTTACT TAAAAGTTCC ACATAAGTTG CTAAGGTTTT TGCATGTTTT TCATCAATTT 12600 

CGGCTTGTTC TTTTTGGCTA ATTGGTTTTA CTGGCTTGTA GCACCAATTA GAGCTTAATC 12660 

CAAATTTTGA AAGTACCGCA TTGATGAATG GCGTTACCAT TAGTTTGCAT ATCTGCTCAA 12720 

TGTTTAGGTA AAAAATATCA TAGTTGCCAA CGCTGCCTTC TCCAGAAGGA GATATTGGAT 12780 

ACAGTATTTC TTTGGGAATT CCTGAATGAA GTGTTATGTC TGATACAATG ATTTCAAAAG 12840 

CATCTTTTAG TGGGCTTACA GATCTTGTTA CATTAGCAAT ATCATCTTCT CTTCCGAGTA , 12900 

TCATCATTTT GTGGTTACTA TCAAGAACCC CCTCAATGTT TTTTTTAACT TCAGCCAGAT 12960 

. CATATGCAGT. CATATCCTTG. ACTGATGGCA GAGTTGCTGA TTT7UVGGAAA GTAAAATTAT 13020 

TTACCCTTAA AAACCCTACC GTTTCATTAA GTAGCGTGTT CATAATATTG CTGCTTTTTT 13080 

TTAGAGACTC AAAATTTAGA AAAGAAGACT TCATGGTAAT GATTCTGCTT TCATGTATAT .13140 

TTTTTAAGAA ATAAGATCCC CCATCAACAA CTTCACCAAA GTTATAGCAA AGACAAGGAA 13200 

ACCCTTTTTT TAGTGGCTTG TGTGGATCAT CGGAATCTGG AACTACTATA TAAAAATGGC 13260 

TTTCTCCAGA CAAAATTGCT GTATAAACCA TTTTTTTGAT CACAGCTCTG AAATTATTAT 13320 

CAAATAATTT TGAAAGTCCA TCATCGACTT TGTGCTCAAT ATCTCTTGAA GATGCAAACC 13380 

CCGCGTAAAT TTCAGCTATT TGATGCGCAa GCCTTAATTG ATCCTGGTGT GGTGTGTATT 13440 

CACTTACTGG AAATAGTTTT GTTTCTTTAG GTTTTTTGAA AAATTTCATT CTAAACATTA 1350^0 

GAAGCTCCTT TAGCTAAAAA CCGATATGGC ATTGAGAAAT GCCGGGATGT ATACCAAATC 13560 
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TTTTTGCATA 
TTCAGTTTCG 
ATTAGACGGA 
ACCTCTACCA 
AACCCCTTTA 
ACATGCGTTT 
AAAACAAATT 
AAGAATTTCG 
CTCTTCTCCT 
TTTTTCAAGC 
TTTGATTATA 
TGATTTAGGC 
GACAAGCATT 
AAAATGCGCA 
TTTTTTCCCA 
TCTTAAGTTG 
GTTTTTCTTT 
ATTAACAGTT 
TTCAGCATTG 
AGTTCACCCT 
AAATTCGTAC 
AAATCTTCAG 
GTTGCTAACA 
GCTTGTTTGC 
TTTTTTAAAT 
GTAAAAAGAT 
GAAAGGTGGT 
AGACATAATC 
TGTCATTCTT 
GTGATTCTTA 



875 

ACAAAATTTCT^AACTTCGCT ATCTTCTGCA 
TTGAACTCTG AAATTACATC AGTGGTTTCG 
ATCAAATAGT CTGAGAGTGA ATACAAGTTT 
AAACGAGAAA ATACATATTT GAGTTCTTCT 
AATTTATTAA TTTCGGATTG GTAATCAGTT 
GTAATAATTA CAACTGGAAG ATAGGAAATT. 
CTGTTGCCTT TAACGTGTAT TCCTGTATAA 
GGACCACACA CATTAAATTT TTTAATTAGC 
AAAACCTCAA TTCTAAAACC AATGTCATTG 
CAAGCTTGTA CGTCTCCACC ATTTAAAAAT 
CACACAGCAG GATTGTCTTG ATTTGATAAG 
ACCGGATTGC TTGACATATA GATTCTGCCG 
TCTATATCAT CAGCGCTAAA CTGATTGGCT 
TAAGATTTTA AATCTCTTGT ATCATGCCCC 
AAAATCAAAC TCTTACTTTC AATTTTTGCT 
TATATGCTTA AAAGTTCTAA AATTTCTTTG 
TTTCTAATTG CAAGGGTATC TCCGCCATCA 
GCAATGTCGT AGGTTTTACC AGTTCCCCTA 
GGCTTTTCTT TGTAGGCATC AACATATACT 
TGTTAATAAT TTTATTGATT TCTTCTTCGG 
TTGTATTGTT TCCAATAATT AATTTTTCTT 
CTTCGCTCAT TTCAAAGACC GCAAAAAACA 
CATTGCTGTT TGAAAATTCA AACATTTTGT 
TGGAATTGTG TACAGTTTGA TTATCAAAAG 
TTTCTTGAAT TTGTAAATTG TCCATAATTT 
ATATAGCAAG TGTTTTTAGG TTTTGTTTCT 
AATAAATATT CGGGGTCTAT CTCTTCATAA 
TCCTCAGCCC AATACCAA6T ATACCAAGTA 
TTTACTAATT TGCCTTTAAA ATTAATTCTA 
TAAGAATCTT CTTGTGTATG CCCTAAGCTT 



• 

AT^AI 
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CTAGATTCAT^ATAATAATA 13 620 

GGTTTGTTTA CCACATTAAG 13680 

CGTTTTTTTG CAAGCAAAGT 13740 

CTTGCTGTTG GCAATACAAA 13800 

TTTGATAGTA AAACTTTACT 13860 

CTTCCAACAA GAATTTCTAA 13920 

TAGCTTCCAT TAGCTCTGGA 13980 

CTTGCTGTAC CAAAATCAAA 14040 

CCATGATATG CAAGTCTTTG 14100 

GGGTTGTCAC GGTAAGTGCT 14160 

TACCTTTTGT ATAGCCAATG 14220 

CCTTGTTCTC TCATTGTAGG 14280 

TCTTCCAGCC ATAAGTCCTT 14340 

CCTTCAAAAA CAAAAGCACG 14400 

TTGCTTATAT TGAAAAATTT 14460 

TGTATTGATT GTGTTGTTTT 14520 

GCACTAAATT TTCTTTCTAA 14580 

CTTGAGTAGT ATATGAAAAT 14640 

GGAAGTCGCC TTAGTCTCAT 14700 

TATAAGAACA ACTTTTTACA 14760 
TGTTAATAAT GTCTAGCACT . 14820 

TTCTGAATGC ATGTAGACTT 14880 

TGACAAACAG TCTAAGCAAC 14940 

AAAGTTTTTC TTCTATTAAT 15000 

TTCTGCTAAA GATCGTATCT 15060 

TTTGAACCAC TTTGACTTGT 15120 

CTATAGCCTG TAATAAAGGG 15180 

TCAGCACTAC GATAAATCAT 15240 

CTGAAGTCAA GATCATGATC 15300 

CTTGTACCGT CAGAATCGGT 15360 
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GGAGCCGCCA GAATCATAGT GTCTCAAGAA TCTGCCCGAC AACTTGGGTG CTGAAGATAT 15420 

TCCTAAAACT TTATATGCGT AGCAATTGCT TGGCAAGCTT CTTCCGTCTG GAATACAAAA 15480 

TTTGTTTGTG TTTGTAAATG CTTGAATCAA TTTGCTTCTT GTAAGGATTG ATCCTTCCAT 15540 

TGCAAATTTG GCAGTCAAGG* TACCTACGGG TGTTTTTTCC AAGAAAAACA AAATCATATG 15600 

TTCTAAATAT TCAATAAGTG AATCTAAACT TGGTGCATTT TTAGTAATTT CATACTCTTT 15660 

TCTGTTATCA ATGTTTTTCC CATCGCATAT TGAGAAAGTA AGCTTATCTT TTAGCAAAAT 15720 

TGGTTCTCCA AGAGAGCCCT GGTATCCCAG CGAGTCTATT TTATTTCCAT TTCTGAATTG 15780 

GATTCGAGTT TTAGTGTTTT CGAGTTTCTT TTTTATTTCT GTGTAGTCTT GTTGTGTTAT 15840 

CATTGATTTT AGCTACCAAT CATATCTGTA GAATGAAATA TAACATGTAT TTTTGGGTCG 15900 

TGTTTCGTCA TCTCCACTGT ATTTTGTGTA GGAAGGGTAT CGCCACGACT GTATTGGTTC 15960 

ACCGTATTCT ATATGAGTAA CAAAAGAGGT GGAGCCTGTA CTCCAATTAG AATCTCTTCT 16020 

GATGGAGGAG TAATCAGTCA CAAGTCGCCC TCGCAGACTA TCCAATACGC TCAAGTCAAG 16080 

ATCATGATCG TGACTCTTAT AAGAATCTTC TTGTGTATGC CCTAAGCTTC TTGTACCGTC 16140 

AGAATCGGTG GAGCCGCCAG AATCATAGTG TCTCAAGAAT CTGCCCGACA ACTTAGGTGC 16200 

CAAAGATATT CCAAACTTTT CTTTTACAAA ACAATTGTCT GGGAGAGGTC TTCCATCTGG 16260 

AATACAAAAT TTTTTAGTAT CTTCAAAAGC TTGTACCAAC TTGCTTCTTG ATATAGATCC 16320 

TTGCTCGACG AATTCTGCAG TTAAAAATCC AGGATAAGTG TTTTCTAAAC ACCAATTAAC 16380 

TAAGTCTTTT AAATAATCAT CTATATTTTC GCCAATAGGG GGCTTGGTAT TCTTGTTAAT 16440 

GGGATAATAT TTTCTATTAG TAGTATCTTT ACCATTGCAA ATAGCAAATA ATTCTTTATC 16500 

^ . TTTAACAACA ATAGGTTCGC CAAGTTTGCC AACATAATTT ,TTTGfCTTCTT CCAT;5i.GTTCC 16560 

AACGCCAAAT TGAATTTTGA TATTGTCGGC TTGAAGTCTT TTTTTGATGT TTTCAAAATC 16620 

ATCATCACTT AACATCTAAG CAACCTCCTG TTTGTCTTTA GTGTTTTCCA TGTAAGTGCT 16680 

AAGATCAAGT GTTCGCACCC CTGCATTTGA TTTTCTTGCT AAATTAAGGG CAAGTGTGTT 16740 

TTTTACAAAA GTATCGCGTA CGATCAAGTC AAAAGCATGA TTTTCAAGTC CAACTTTATT 16800 

TTCTGTAAAC GTATTGTTAC TTAGTCTTGC GCTAGTAATA TCTTGTAAAT GCAGCGCAGT 16860 

ACCGCTATTT TTGATAAACT GTGTGTCGGT TATTTTCAAA CTTGAAAAGT TGGAAAGCTT 16920 

AAGCGCATTG GTGTTGTTGG TAAAGAAGCT TTCTCTAATT ATTGCATTAA GTCCATTTGC 16980 

AACTGATGCA GTTTTGCTTC CTTGAGCATT AACATTAATT AGTGTTAGAT TGGTAACATT 17a40 

TTCTATGTCA AAACTTTGAT TTGTAGAATC AAAATTTACA TCTTCAAGTA AAATTTTTTT 17100 
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TGTTTTTTTG 
CACAAAGCTT 
TGAGCAGAGC 
TTCTTGTTGG 
ATTGACTCCA 
GCTTCTTATG 
ATAAATGTAA 
TTCAATTGAA 
TTCGGCCCCA 
GCTTATTCCT 
GATTCCCTCG 
TATAAGGAAA 
ATTTAGATTC 
TAGGAATTCA 
AAACTTTTTA 
GTAGAAAACA 
AGTGTTTCTA 
GGAGGAGTCG 
ATTTATGGCG 
ATCTAACCAG 
GGGGTACACT 
ATTGATTGGG 
TTTGCCTTCT 
AACATAACTT 
CCAAATTGGA 
ATACAACAAG 
GACTTTGTCA 
TTCTATTATT 
GTCTGGTAAA 
AGAGTAGTCG 
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aaatgcaatJ^^ttgtttaa tgcgcacgta 
gcatctgtaa catagactga tgatctggcc 
actacaacag cgggctgtgt aaagcttttg 
tttagatctc ctccgttaat gtaaagttga 
gaaagcctga atgatttttc tgatgtaaaa 
aaaacttcgt catcgccttc gatttctaaa 
aaatcgcctt taagtagttt gatcttgtta 
ccatttaaag tattttcgtc tttaaacccg 
tcataattaa acggtgcaat aacaactttg 
attttggttg aagttgtaag gtattcgtaa 
tactcgtaaa gtttgatatc cagatcgaaa 
aaatgatcaa tcccaatatt gtcaagtcta 
tgcattgacc taaaattaac aatagtgtgt 
aaaagtctta atgctgaatc ttcggaaaaa 
gagtaaaaat catcagcatt gtcggtttgg 
tcaccataaa tgtcaaagtg gtaaatatat 
aaccaaagct tagcctttgt tggaaaatat 
gcactaaacc ttacttcaag gttatgagtt 
tagtggtcgt gccaaacctc gcgccttttg 
ctaggatcgt attcttgaaa aacactgctt 

ACGCCTTTTT GAAGAACTCc' "iu^CGTACAGT 
GCTGAGTACA GTGGTCGTTT TTTGGACATT 
CTCCAAATAA CTTTAGTTGA ATCGTAGCTA 
TCAGCATCCA CAGTACAAAT TTCAATTTCT 
AGTATTTGTA GTTTGCCGAC TGAAGAGAAA 
GCTTGCAAAA TAGTTTCTAC ATCTTCTCCA 
AGTATTGCTT CGCTAGCATC ATCATCAATA 
AGATGGACAA GTGAAAGTTC TTTTGCTAAA 
AAATTGATTG GGAATTGAAC TGGATTTTCG 
TTAACGGTGA ATGATACAGT TTTGGTGCTA 



c 



AATGTGACAa^PlTTGATGTA 
TCTTCTTGCA ATGAATATGA 
TCTTCTAGGT AAGGTGCCAG 
CTCATTGGTT GTTGACATAT 
ATATGTTTAG AAAACCCCGT 
TTGTTTAGTT TTACTTGATC 
AGTCCAGCTT GTTTTGCAAA 
GAGGCTTTAA ATTGGTAAGT 
TGAGCCCCAG ACAAATAGTC 
TGAGTGTAGT CACCCCAAGT 
TTAGTAATTT TTTTTGAAAG 
AGTTTGACAA AATCGGTTAT 
CCTTTGACAC GTAAGTTTGT 
ATGAATCTGG TTGTGTATTC 
AGTACATTTT GAGCTATTGT 
TTGGAGCCTT GACTACTAGA 
TCTTTATTTT CAAGCTTGAT 
GAGATTATTG CTAAATGTTC 
AAGTCCCATT TGTAAACTGT 
CCGACCTTGT CTGCAAAGTC 
GCACCATCGG TACCAGCAAC 
GCTTCTTCTT TGCTTTGGAA 
CTGGAGCTAC TTTTTGACAT 
TTAGTAATAA CTTCGCTTTT 
GTGTATGCGT ATCCGAATTC 
GAATCAATGA TTACAGCGGG 
AGGTCTTTTA GTTTAGTTTT" 
GGATTGTATA CAAAAAGCQA 
AATGCAATCT TTAGTAGGCT 
TTGAACAGAT CTCTGCTGAA 



17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
.17820 
17880 
17940 
18000 
18060 
18120 
18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
1866^0 
18720 
18780 
18840 
18900 
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AAATTTTTCT 
GTCTTCGTTT 
GCTGAACGTG 
GCTTGTAGTG 
AATATCAAGC 
TTCAGTTTCG 
GTCTTGATCT 
ATACAATCGG 
TATTTGTTTC 
GAAATTTGTC 
TTAGTGCGGT 
CTTTGTTTGT 
GTAACAGTAG 
GCCCCCTTGA 
CTTTAAAAGC 
TTGTATTGAG 
ATCTTCATTG 
TGTAAATGTC 
TCCCTTTAGA 
TGCGTTCATT 
TCCTTTACGC 
TGTCCGTTTG 
CTGTTTAAGA 
ATATCAGATT 
TCATCAATAC 
CTTAGGCAGC 
CATTTTTCAA 
AAATAACATC 
ACGGCAATTC 
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AGAATTCCCC TAAAAACGGG GTTATTCTTA TCATTTACTT TTACGAAAAT 18960 

CTGAAGAATA AGAAATTCAA AAATTCTTCT GATAGGCCGC TTACACTAAA 19020 

CTTGCTGCTG TTTTTAGGCT TGGATCAACT ATTTTTTCTT CTAGAACAAT 19080 

TCAACAAAAG GGGTAAGTTC AAAAATTTGA CCCTCGTCCG TGTAGAATAC 19140 

.CCCAAAGAAG TACAATTTTC CGATGTATCT TCTTTGGGAT TTGAGATTTC 19200 

GCACCTTTTT CGGTTTCTTG ATTTAAGGCT TCGGATTCTT GACTTGAATT 19260 

TTCAACTTAA TACAATCCTT ATCTTCTGCT GTATTTTTTG TAACACCCAA 19320 

TTCGGTTTTT TCTATGTATC GATTGTAGTA GGTAATTCGA TTTTTTAGTA 19380 

TTTAGTTCCA TTTTCATCGC CAAACACGGG ATCAAAATTT TCAAACACAG 19440 

ATTAGGATAG TATTTGATCA CATAAGATTT TACAGTCAAA AGCCAAACAT 19500 

TGAGTATCTA AAAAGTTCTG CTTCATCGAG CATTAAATTT TCAATATCTT 19560 

TAGGGTTGGT TTTTGGGGAA GTGATGGTAT TGATTCGCAA GAAAGAAATA 19620 

CCAAAATATC CCTAAAAAAT TAATTTTTGT CTTTAAATTT TTCATTATTT 19680 

ACTTGATTTT GTAAATCTTT TAACATTTTG CTTGTGACTT CGTCTCTAAG 19740 

TTTTTGTATT CTGAAAAATC ACCTCCAGAA TCTTTGTAAG CTTTATAAGC 19800 

AGTTCAATTG TATCTTTGAG TCGTTTATCA ATTTGCTCAA CAGCTGCTTG 19860 

TTTTTTTCGA TTTTGTCTTT AATGTAGAGT ATGAATTTCA AAAGTGAACT 19920 

ATTCCTTCGT TTACAATATC TAATTTTTCG CTACCAAAAG AACTTTCAAG 19980 

AGTGCATTTT TGACGTCTAC TGCGTCTAGT AACTCATTAA TGTTTTTAAT 20040 

ACGCTACCTC CAAATTATTT CTAAATTTTG CACTGTAAAA TTCTAGTCTA .20100 

GGTCTAAAAT TGCTTTATTT TGAATTTTAA ATGCTCTTAA AGACTCCAAG 20160 

AAACAGTTTT AGAATTGCCA AGTGAATCCC AAATCACAGT TTTTAGGTCA 20220 

TTACAAAATG GTAAAAATTA GAACTTGTGT CTTTGTACTT ACCAATCAAA 2 0280 

CTGATGGGAT ATAAGAGGTT GGATGATGTT TTTCTTCGAA GAAAATATCT 20340 

CCAAGTTTGC AAATATTGCA TTTGGAGAAT TAACAAATGC ATTGTCACCC 20400 

CTTTACTTAC AAGACCTTTG AAAAGTAAAT CAATCTCAAA ACAATCAAAA 20460 

CGCTGTTTTT GATTTCTTTT ACCACAAGTC CAATAAATAA AATACAAAGA 20520 

V.' 

CAAATTTTGA AATAACCTCA TTTTGTTCTT TGAATTGCATP TTGCAAGGGC 20580 

TGTGAATTTC CACTTCTTTT ACAGTTTCTT TGTAAGAATT TTTGAAACAT 20640 
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GCTGCACTTT 
TAGAAAAAAT 
TAAAATTTTT 
AAATATTTCT 
TTCTTTTTAG 
ATTTAATCTT 
GGACTGAAGT 
TAGATATTAC 
TCATATAATT 
AAAATAAATA 
GTCAAAACTA 
AAAACCAAAA 
GTGCATGGAG 
AAAGTTTAAG 
GTGTAAGAGG 
AAAGTGTTAT 
TGTCCTAACA 
CAATACGATA 
AACTCTTGTG 
CTCAAAAAAG 
Cf TAACGAAA 
GGAAAAGGAA 
ATAATTTGGG 
GGTGATTTTG 
TATAATGCTA 
TCTAACAATT 
TTGAAATCTT 
TCGCGCCACT 
AATTCAAAGA 
AAAGATATTG 



VTT^^GJ 



879 

CGAGTAATT^^GATTTGTAC TTTTTTATAA 
TGTAAATGCA TAAAAACATT TTGTTATTCA 
TTCTATTTCT TCTTTTAGAA GTTCTTGTAT 
AACTTCCAAT ATCAAATTTT CTTTATTAAC 
TTCTTCTTTT AGTTCTTCTT TGATGGAGTT 
GGCATTGTAG TAATCTTCGA GTTCTTTAAA 
TTTTAGATCA GCCATCACCC CTTTAAAAGC 
TAGCATTGCT ACAATGCTGC CAATAATATT 
CCTTTATTTT TTTAAATTTT TAAAAAAACC 
AAATATGGTC TAGCTAGACT GGATTAAAAA 
TTACATTATT AGGTATTTCG TAATTGTATA 
ATTTTTTGGA TTTTTTTAAG ACAAAAAACA 
AGGCTTATTT TTTAGGAAAT GCGTCTTAAA 
TCGCGCTGCA TGCAGCGCGA CTTAAGCCTC 
ATATGTAAAC ATATATGAAT AAAATATTAT 
TACATGAATT GCTTACCAAA TTGGTAGCTT 
CGATTAAAGT GTCTCAAGTT GAATCACTGA 
GGCTTTTAAA GGTTTATTGG GTGATTGATG 
GAGTTGATCG TTATTCGGCG TGCGATATTT 
ATGGCAAAAA GGTTGTTAGT GTGCGCACTG 
TTGGCTTGAT TAAAACTAAG TTAAGAAAGT 
GCATTGCTCA TTATATACAA AATACTGAGC 
AACATCTTGT TCAATTACTT TATGAAAAGC 
ACGAAGACAT CAAAAATGCG GTGTTTAATG 
ACAATCCATT AAAGGATCTT TCCGATACGT 
TTTCAGATAA ATTTTCTAGA CATTCAGAAA 
CATGCGACAC TGTCTTAACT AATCAGGATQ. 
CGCCACCGGC TGTATTTAAT AAAGCTAAjTA 
ATTCTTTATG TAATTCAAAA ATTCAAAAAA 
AGACTAAATT GATCGAAAGG AATATCCCAA 
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AGTAGTCTl^^AAAAGTTTG 20700 

TTTGCTTTCT CCAAGTTTTC 20760 

TTTGATTCGA TCTTTTGAGA 20820 

CGCGTTAATA AATTCTGTAG 20880 

TTTCATTTCT TCGAATTCAG 20940 

GATTTCGTGT TTGGCTTTTA 21000 

GTATGTGCCA AGCCCAGAGA 21060 

TATTTGTTTT TTTACTCTTG 21120 

ATATTTTACT TATTTTTTAA 21180 

TCCAAGTGTT ATCCAACAAT 21240 

ACGTTTTTGG TAAAAATCAA 21300 

CGAATTGATA TATACTTTAC 21360 

AAAAAATTTT AAAGGAAAAT 21420 

GGACACAAAA TAAAGTTTAT 21480 

TAAATAATGC TAGACTTAGT 21540 

TAAACAGTAA AAAAGAACAC 21600 

TCAAAAAAAT GAGATCAAAC 21660 

TCAAAAATCA AAATTACAAA 21720 

ATAGACTGGT TGCTGATCTG 21780 

TGCAGCGGGA TCTTAAACTG 21840 

TCGGTAATAA GGACAACAAA 21900 

TTGTAGCTTA TCATAAGGAA 21960 

TTGAGAATAA AAAAATAGTT 22020 

TTTCTAAGAC TGCTAAATTT 22080 

CCAATGGGGC CTCTAATTTC 22140 

GATTATCTGA AAATATTTTT 22200 

TTGACAGTCG CACCACAATG 22260 

TAAGCTATAG TAATTATAAG 22320 

ACAATATTAA TTTTGAAAAA 22380 

AGGATTTTCT TAGTCGCATA 22440 
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AAAGATCTTA 
TTAGACGAGC 
TCTATTTATC 
TATGAGGTCA 
GATTATGTGA 
CGTTTGGAGA 
TCAAATAATC 
AATAGAAATA 
ATTAAAGGAA 
GCTTTAGGAG 
AGGGACAAGA 
AGCATTACTA 
TTCGTGGATG 
GTAGATGGTC 
GCTAGGATTG 
GGTGCACAAG 
GGATAATATT 
GACCAGTAAA 
TTCAGAATCA 
GGTTGATGAA 
TAAATACTTT 
CGTTTTTAGG 
ATACTTCTGT 
TTGAATTTAG 
TTAGGGATAG 
TAGAAAAAGG 
TAACTAAGTG 
TGCTTCGCAG 
GGTAAATTAT 



GCAATAATCC 
ACAATGAGAG 
GATATAAAGT 
TTTGGAAGGA 
AAAAAGTGCT 
GGATTAATGG 
AGGAGCAAGA 
ACATCTATGG 
TTACTCTTGA 
GTAAAATGAG 
TTTGGCATGT 
ATTTTCCTAA 
AGTGGATTCA 
TTGAATATAT 
TCAAAGACTA 
CGGGATCCGG 
AGTTCACAAA 
ACCCGCAAGT 
TTCTTTTTTT 
TATTTATAAG 
TAGCAAAGAG 
TATATTTTAT 
TTGTAGCTTT 
ATTTAAAAAG 
AGATAGCTAT 
AGTATTTAAG 
GATAGATAAA 
TCTGCTACGT 
GAAAGTCGCT 



TACAACTTAC 
TAATTTGAAG 
TTGGATGATG 
AAGGTTTGGG 
TTCAATGGAG 
TCAATCGCAA 
TAGCGTAAAT 
AAGAAGTAAC 
AAGCCTTGGA 
AATAAGAATG 
TTACAGAAGT 
ATTAGAACCA 
GAAGAAATAC 
TTGTAAGGCA 
TAAAGATATA 
GGGGAGTGGA 
AATAATAAGG 
TCTGAAAAGG 
AAAAAGGAAA 
GGTTGTCGGG 
AGAAGATTTA 
GGGTACAATA 
TCTAAGAAAA 
GGGAGTGTGT 
AATAGGGAGC 
TTTTATGGTC 
ATCAATCAGA 
AGTCGACTCC 
AGTCTTATAA 
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AAAAATGCAC TGTATAATCT GGATAAGGCC 22500 

TATGTGCTTG AACACTTTTT GGATCAGTTT 22560 

ATGAAGCGTA GGGATGGGGT TATTAGCGAT 22620 

GAGTTTGTTA AGAAAAAAGT TGAGCTTAAT 22680 

GCTAGAGAAA GAGAACAGCG TAGTAGAGAG 22740 

GCACAAGTGC AAACGCAAAC AGGAGAATTG . 22800 

ACGCCGCCGG AGAGAATTTA CTTAGGGGAG 228 60 

ATCGTTAAGG ATTCCTTGGG CTTTAAGACA 22920 

ATTGATAAAA AAGCAATTTA AGCCTAGGTG 22980 

AAACATTTAG TAAGAAGGCT TTACTTAAGA 23040 

ACGGAAATTC AAAACAAAGC TAAAGACAAA 23100 

GAAGATTTTG ACTATGAGTA TATTTACAAG 23160 

AACGATAAAT TAGGGTTTAC CATCCAAAAG 23220 

AAAAGGTATG CAAGTTTAAA GAAAATATTG 23280 

T.TTCTTGGCA GGTTGCAAAA GAATGTTGCT 23340 

GGTAAGGGGA GCAAGCCGGC GGGAACAGGA 23400 

AGGAAAATAT TAGCTTTAGA ATAGTAAAAA 23460 

TTGTTGAAAC TGATAAACAG CAGATACCTT 23520 

TTATTGGCGA TAAAACCAAT TACCATACAA 23580 
CCTATAAACA TAAGTTCTGT jSCTTATTTTA . 23640 

TTATGCTGTA CCCCATAAAG GAGGGAGATG 23700 

AGGTTAAAAA TAATCCATTT TACAGAGATT 23760 

TATTTAAATC TTTTAACAAA TCGTATTTTA 23820 

TTTTGTATCT CCACACTATA GCTTATTTGC 23880 

AGAAAAAATT ACATATGCGT CTGATGGAGC 23940 

GAGATTTGAA TCCCCAGGGC GAAGGTATTA 24000 

AAAAGTTGGG CAAAGAGGAT AATCCTAGTT 24060 

GTAGATTTTG AATTTACAAT GTTACTAAAG . 24120 

GGTCAACTTG TCAAAATGAA AATTTAATTT 24180 
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TGCGGAGCGG ATTTAGAG^WtTGATGCTA TTATACAAGG 
TAGTAATTGG AGCACGGCCC AGTGTTGGTA AAACGGCTTT 
ACATATGTTT AGAACAAAAT TTGAGTGTTG GATGGTTTAC 
CTGTCACTCG GAGGCTTTTG TCGATGAATT CGGGCATAGA 
ATATCAGTTC GCTAAATAAA AGTGAACTGG ACGCTTACCA 
GTAATTTTTC TTTTTGGATT AATAGCQTTT GGGGTACTGA 
AAGCTAGACA AATGAAATTG AACCACGATG TAAAAATTAT 
TGATTCCCGT GTCACAGAAT AATATTCCTC GTTTTGAACA 
ATATACGTTC GCTTGCACTT GAACTTGGAA TTCCAATAAT 
GAAGCGCTGA GGTTGTAGAA CCTAGTTTGG CAACTTTGGG 
GGCATGCAGA TATTGTAATT TTTTTACATC AAGAGAGGAA 
CTTCTAAAGG TAATAATACA ACTAAAGTAA AAGTGATAGT 
ATATTGGGAT TGCCAATTTA GGTTTTACTC CAAAAACTAT 
TAGATTTGTT AGATTGTTAG ATTTTGTAAA TATTCTGTTA 
GAATGTATTT AGTAGGTGAG TAAATTATGA AATCATCAGT 
AAGAGCAAAT ATATAAAGAG TTTCTGCGAC TAGGTATGGA 
TATCAAAAAG ATATTATCAC AATGAACTTA CATATAGAGA 
AATTTGGCAT AAAGTTTGAC AATCTTGTTA CTAAGATTGA 
CTACTAAGAT TGATAATGTA GAT^AAGAATT TACAAAAGGA 
AGATTGATAC TGTTAAAAGT GAACTTACTA CTAAGATTGA 
AAAAGGATAT ATCCAACTTA GACGTTAAGA TTGATACTGT 
AGATTGATAA CGTAGAAAAG AATTTAGATA CTAAGATTGA 
ATACTAAGAT TGATAACGTA GAAAAGAATT TAGATACTAA 
ATTTGCAAAA AGATATGTTT AGTTTGGAAC AAAGGCTAGA 
ACAAACTTCT TTTGGAAAAG CTGGAAGCCA ATAACAAACT 
CCAATAGCAA AGTTCTTTTG GAAAAGCTAG AAGCCAATAA 
TTAAAGTCAG CAACAGAATA- GTTATTATTG CAGTAGTAGT 
TTCTAACTCC CTTCATT^CG TCATTAATTA GCAATTATTT 
TTCTTTACTT TAATCAAGAA AAAAAATTTT AGATATAATG 
ATTTTTGTAG ATTCCCaGTT TTTTTAGGTT AGCATTAATG 
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CTTTAGGGATP^AAATTTTG 24240 

TGCCCTCAAT ATTGCTCACA 24300 

ATATGAAATG ACAAGTAAAA 24360 

ACATAATAAG TTGCTTGACA 24420 

TAAATCAGTT TCTGAGGTTA 24480 

CATACATGAG TTAGAAGATA 24540 

CTTTATTGAT TACATTAATT 24600 

AGTTGCATTT TTGAGTCGTA 24660 

AGTTGTATCT CAAGTTTCCA 24720 

AGAATCGGCA GCATTACAAT 24780 

AAAACGTAAA GGGCGGAATA 24840 

TGCTAAAAAT AGAAACGGTT 24900 

AAAATTTTCG AATTGAAATT ' 24960 

TTTGGCCTTA ATTTGTGTTA 25020 

AGTGACAACA AGTATTACTG 25080 

ACAACTAATA GCTCAAGATT 25140 

TTTAGAAAAT TTAGAAAAGC 25200 

TACTGTTAAA AGTGAACTTA 25260 

TATATCCAAC TTAGACGTTA 25320 

TAACGTAGAA AAGAATTTAC 25380 

TAAAAGTGAA CTTACTACTA 25440 

TAACGTAGAA AAGAATTTAG - 25500 

GATTGATAAC GTAGAAAAGA 25560 

AATAAAGCTG GAAGCCAATA 25620 

TCTTTTGGAA AAGCTGGAAG 25680 

CAAAGTTTCT TCAGAAAAGC 25740 

TGTGCCCACT GCTATATCTA 25800 

CAAATAGAAA TTGCAAAGAA 25860 

CGCTTTTGTA ATTTGCAAGT 25920 

TATAGCGTTA GAGTATGTAA 25980 
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ATTTTTGCAA GGTTCCTTTT CAGCAATAAA ATTTGAAATC 

AAGCTCGTTG GAGCTGTTTT TATAATAATT CAGATTGTTT 

AAATGATTTA ATATAGTTAA GCTTTTGTGA TAGATTTAAT 

AAAGATGCTT. TGTGAATTAG AGTTGTGCCT AACTTCATTT 

AATCAAAGAG TAAACAATTC TCAGTTGTTT AGTAGTAATG 

TGCCACATAA TTAATTCTGG TTGTATTAAT AGATATCAAT 

AATACATCTG GAAATTTTAT TAGAGCAAAT TAGGGAATGT 

GTCCAATGTA TAAGAAATTG TATCAGATTG GAAATTGTAA 

TTTCAGATGA GTTAATGGAA TTCCAGCAGC CATAATAATT 

GCTAGAAGAA TTAATAAGAT TCTCGCTAAT TAAAATAAAT 

AATTTTTTTT TGTTTGGCAA ATTTACCTTT TAAAAAAAAA 

ATTATATACT TTTTTGTAAG AATTTCAAAA GAAGTTATAA 

ATTTGGTATT CATGAAACAT CTAAATTAAA AATTTGTAAT 

TTTTGGTTTA AATGTTAACC CG 

(2) INFORMATION FOR SEQ ID NO: 8: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 18359 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



AAGTTTGTAA TAGTAGATTT 26040 

TGATTGAGCT TTAAAGGTGC 26100 

ATGCACGGCG TGTTAACTAA 2 6160 

GGTGTTTCTT TAGACTTTGC 2 6220 

TCAAAACCAA ATATCTTTTT 26280 

CTATTTTTGT CTAGATTTTC 26340 

GTTTGAATTT GTAAACCGCT 26400 

GGAGTTTTTA TGTTTTGATT 26460 

CCAAGTAAAT GGTGTTTAGT 26520 

TCATTCGGAT TTATTTTATA 26580 

TTGCATAAAA ACATATAAAC 26640 

ATTTGTAATT TGGAGATAAG 26700 

TTGAGGTTAG TGCCTAGGGT 26760 

26782 



(xi) SEQUENCE DESCRIPTION:, SIEQ ID NO: 8: - ^ 

CTATnTACAT CACAGCTTAC CAATGcTATT TAAATAAACT AGAAAGCAAA CCACAATACA 60 

TGATTAAAAT GATATGGGCA ATAAACTTAA AAAGTTTAAC GATAATTTTG AAATTCTTAT 120 

TAGAATCTAA TTAAAAATGT AAATTTATAT AAATTTTATA AATAAAGAGT CAAAGAAAAC 180 

GCTTTATACT AGAAAGTCTT TATAAAGATA ATAAAATATA TTTTTTAGAA CTTTCTTCAA 240 

AATATAAATC TTATATAAAG AATATAAAAA AGAAAATAGA ATTTCAAAAT CATTAAATAT 300 

CGAATGATAT TTTTAAAATA TAGTTTGAGG ACAAATAATA ATCGAATGAT TTTTGAAAAT 360' 

TAAATTA.TTT AGATATTTAG ATATGGAAAA AGCCCCCAAA GGGGCATCTT TATCTGCGAT 420 

GATAAACCCT AGGAGAAAGA ATTGCCTCTA CCCTAAATTA ACAATAGTAC TAAAGTATAG 480 

CACAACATAA AAATACTTAA CAAGATTAGA TTGATTCAAA CTAGACTAAG AAAATTTAAC 540 
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^ 883 fl^ 

AAAGATAATG TTGAACATGG AAGTGTTGGC CAAGCATAAA GAAATAATTO^ACTTGOAAA 600 

CATCTTGTTT CACTACTTGA AAAAAAATGA • AAATAGCCGT GTCAATACGA ATACAGCCCA 660 

AAATATCTAA AAACCTACAA AAATATTAGC TGATTATATC TATTTTTTTC TTAAGTGAAT 720 

. ATGAATAAAA AATTCTTTGT AATTTCTATT TAAAAAATTT AGCAATTAGT AGCATAACAA 780 

TATTTGTTAT GCTAGATATA GCAATGGGAA CTATTATTAC TGTAATAATA ATTATTATTC 840 

TGTTGCTCAC CTTGAGTTTT TCCAATAAAA ATTGACTATT AATTTGAACT . TCTTTTTTAA . 900 

GAGCTTCTGC CAAATTAAAT ATGTCTTTTT GTAAATTCTT TTCTACAGAA TCTATCTTAG 960 

CATCTAAATT AAATATGTCT TTTTGTAAAT TCTTTTCTAC AGAATCTATC TTAGCATCTA 1020 

AATTAAATAT GTCTTTTTGT AAATTCTTTT CTACAGAATC TATCTTAGCA TCTAAATTAA 1080 

ATATGTCTTT TTGTAAATTC TTTTCTACAG AATCTATCTT AGCATCTAAA TTAAATATGT 1140 

CTTTTTGTAA ATTCTTTTCT ACAGAATCTA TCTTAGCATC TAAATTAAAT ATGTCTTTTT 1200 

GTAAATTCTT TTCTAAAAAA GAAATCTCAG AAATAAGGTT CTCGAACCTT ATACCGAATT 1260 

GTTTTTCTAA ATTTTCCAAA TCTCTATATG TAAGCTCATT GTGATAATAT CTTTTTGACA 1320 

AATCTTGAGC TATTAACTGT TCCATTCCTA GTCGCAGAAA CTCTCTATAT ATTTGATCTT 1380 

CGGTAATATT TGTCGTTGCC AAAACTGCTT TCATAATTCA CTCACCTACT ATATATATAT 1440 

TTTAACATAA ATCAAAGCCA AATATCGGAA CATTTCCTTC AAAATCTCAT AAAGCAGATA 1500 

TAATGCACAC AAACTAAATA TATTTTCATA TTTAATCCCT CTTTATGAGA AAAACTTATT 1560 

CCACTTTATT AGGACCGCTA CCCACCTTAA ATCCAATTTT TCTAAAAAAA TTTATTTTAT 1620 

TCGTTGATAT TTTAGTAATT TATATAATAA TAAATTGAAA TTATTAGATA AAAAGCTAAA 1680 

GCTCATAATT TCAATTTATC TTGATGATTA AAAATTCAAA ACAAATAAGC ACTTAAAGAT 1740 

CTAAGCGCTT TATATCTAAT AAAATTTATT CTTTTGAAAC TCTCAATATC AATGCTTGGT 1800 

AAACTTTTTA AACAATCAAA ATAACCTTGC ACATAATATT ATTGGCTCCA GAATCATAAA 1860 

CAAAAACTAC TTTATTCCCT TCATTGCCAT TAACTTGAGA CATACACTGA AGCTTTGCTT 1920 

ipCip.pijupii«jujup AA/^AAAGTCT ATCTACTTTA ACATCTGACT CATTAATGCC TTCTTTGACT 1980 

TTTTTTGTTG TAACTTTTTT TGATTTATCC CTACATTTTC TGCAAGTCTT AAAAAGATAT 2040 

CTACTTGCTA TTTCTTATCT TTTTGATAAT CATCTTCAAA ATTTTTAGCT ACATAATTTT 2100 

ATTTTTGGCT TTACTTATCA AATCATTAAC AAGATTAATA TCGCAAAAAA ACAAAAGAAT 2160 

AGGGTTAAAT AGATCCCACT AAAACACTTT TTAAATAACT CTCATCTTCC TGAATTATTG 2220 

AATCACAAAC AGATTATTTT CCAAAAGTAT TACTATTATT TTTTTCATAT AACTTTAAAA 2280 

TCTACGTATT GATTTATAAA TTCTCTGATT ATATCAGTTA CTAGGCTTGT AAACAAAAAA 2340 
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GGCCAGCGAA GCATCAAATG CTTCGCCTAA CCTTCTAAGC TGCTTGCCTT AAAGTCCTTA 
AATTTCTGAT TTAACTCCTA AGAAATGTCA CTTATTTTCC AAGTCTTCCA ATTTAGTTTT 
TACATTTAAC ACTATCTTAA ATGTCCCCCA CAACTAATGA CAAATTGTAA TTAGACATCA 
CAATTAAAAG TATCTCTATT TTTTATTTTA TTGCTAATAC CCTGAGAAAG CCTATCTACT 
ATTTATTTAA ACCATTCAAT TCTCCATTAT TTATTACAAA TTGAAAAGCA CCCGTTATTT 
TTTATAAACC AATAGCCATA TAATTTAATG TGATTTGTTT CATCTAATGT CTTCTAGTTA 
TAGGGTTTCT TTCTGCATGG GGGCTGCCTA AGACTTGATA TGCCACCATT ATAACACTTG 
CAAAAAATCA AGTAAAATTG ACCATAACCA CTCTTCCACA AAAGCAAACA TAAGTGGTAA 
TTATAAATCT AATAAAATGC AAGCCATTTT TTATTATTAC AAACAGCGTA AAGTGGCTCT 
TTTAAATTTT AAAAAGTCTT TTTTATTAAT TACCAAAGAT AAGTAAACTT GCAAATAAAA 
CTACACGTAT TGAAAGTAGA TTTGAAATTT CCATTATATT TATATATAAT GGCACTAAAT 
ATCTGAAAAT GAAGGAGAAG CGGGTGGGCA ATAAAATTTT TTATATTTCA GTGGTTTTAA 
TTTTAATAGT TGGTTGCGAC TGGGGAACTA TTAAAGATAA AAGTACAGAA ATTTCCAAGC 
TATTAAGAAC GGACAAAGAT AAGACTAAAA ATCAAGATAG AATAGAATTG GGTGAAGATA 
ATTTTGTATC TAAAAATAAT ATGTCTACTA CTGATACGGG CATTACTAGT TTAGGAAGTC 
TAAACAACTT GGATTTAATT AATCGTTCAC AGCGGGTCAG TGAACCACCT ATAATCTCAA 
ATGAGAAAGC CATAGCTACT CAAGCAAAAG TAGATTTAAT GAACAACATT AATGTTACTA 
TAATAAACCC AAAACCAGCT CAAAATTTGG GAAATTCTTT AAACAATACT ACTACTGAAG 
ATAGTGTGAA GTTTTTATCA ATTGAAAACC AAGAGTGGCT TATTAGTAAA AAGATTTTGG 
CCAGTAAQTT GGAAAATTTA GAAAGCTTTC TAAAAACACA ACACGAAAAA GAAGCTTTTA 
AGACGGCTAA AACTATACAA AGTCTCATTA GTAATTCCAA TATGGGTAAA GAAATTATTA 
AGTTTAAGGA AGAATATTAC AAACTTTATA ATTTGTTTGA AGGCATACAA CAAAAATTCC 
ATAGTCAAAG GAATTCATTT ATAAAAGATA CTAAATTTGG GGAAAATAGA CAAAAAAATG 
CAGTTATATT TAAATCCTTT TCATCTATAG AGAAAGAAAT TAGAGATTTG AATTATAAGT 
TGmGTGAAAT CCAAAGTAAT TTTCAAATTG CAGATGTTAG CTGGAATAAT GCAAACTCTC 
TTTTAAAAGA ATCTATAGAA AAATTAATTC AGGCAATTGA AAAAAGGTAT GACAATGAGA 
GTAGAAAGCA AGGTCAAATT GGTGGACCTG CTAATAGATG GGATAAAAAT CAAGCTGACA 
ATTTTGCTAA GGATGCAAAG TATAAGGCAG AACATTCAGC AAATGATTTG GAAAATGCAG 
CCAACTATTT TAGATATAGT TGTTCAAATG AAAAAGAAGC TAAAAAGCTA TTAGAAGAAA 



2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 

- 3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 

. 3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
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wKk 885 (j^^ 

TTAAAAAAAG ATTTGTACG^^TTGGTATTA GCCTATAAGT AAATTTGAA^^TTTCAATTT 4140 

TAAGTATTAT GCATAAATAT TAGTAATAAC CTAATATTAT GCATAATATT CCAATCTGAG 4200 

ATTTCTCTAT ATATTTTTTA CTTTCCCAAC TTTTATGTAT GACCCTTTTG ATTTCTTTTT 4260 

TATAAAAAAT ATCTTCTAAG TAAATTTAAA AGTATCGCGT AAATAATATT GTGTAGAAAC 4320 

TATCAAAACC AAAAAGTCAG AAACAAGCTT TAACACAAAA TATCAAACCG CCTTACCCAA 43 80 

CGGACTTTAT GCACATTTCT TATCAAATAA ATCTAAGTTT TTCATCTTTA CTCTTAACAC 4440 

TATATTCTGA ATAATAAATC CTTGCAAACT CAACCAAGTA TCAATTTTTG AATAAAGAAT 4500 

ATAAAATTTT GGATAATGGG GTTTTAAAGC TTATTGATTT TAAGAAGAGA GGCAAGAGCT 4560 

TGCTTAAGAT AAATTTATCA ACTTTTTCAG AATATAAATA CTATCTATAA ACACAGCCTG 462 0 

GAGAGGGATT AATATTAATC TAAGCAAAAT AAACACAATT AAAAGGCGAA AACTAATATA 4680 

ATTGCTTTAA ACTTTTTTGT TTTAATCTTT AATTATTTAT AAGTCTGCAT TCAACTATCT 4740 

CATATATAAA GAACTGGTAA TTACTTTTGC AAGAAATCTT GTGCCTTGGG TCACTTTAAC 4800 

AACATTAGAA ATGGATTTTA TAACATCTTT TTTTGCCACT GCTTGATCCT TATTTGATAG 4860 

ACTTAGACTT AAAAATCATT AATAATAATA TTGACCCTTC TTTGGCCCCC TTAAACCGCT 4920 

TCATCTAGGG CATCTTCAGA AGCTATTAAA GCTTTTTCAA CTTCTTCTAC TTTAACAAAT 4980 

TCTTTTTTTG TCAATTCTAA TTCCTTATTA TTTGGAGATT TATTTGACAT TATTTATCTC 5040 

TCTATTAAAG ATATTGCCTT ATTCTACAAC ATAAACAGCC TTTTAAGCTT GAGCGGCCTT 5100 

TTTAGAAATT TTAACAACCC TATTTAATCC TTGGCAACAT CAAAATCTTC TTCCCTCCGA 5160 

AAACTTTGCT ACAATCGCTG CTTCTTGTTA TACAACAACA GCTCTCTTGA TAATAAATGA 5220 

CATCAAAAAC ATTGAACCTA CAAACTTTTT AACTATATTC TTGTCAGTAA ATTTAATTAA 5280 

CTAAAGAAGT GATTCTTTAA CACTCTCCCT AATTTACTAA GAACACTCTC TGTTAACTTT 5340 

TTAATAGTAT CTAAATATGG ATTAACCCGA TATTTTTAAT CTACATTTAA CCATCTTTTT 5400 

TATCTGATTG TCCTAAAATA TTAGATTGAA ATTGAATAAT ATTCACATTA TTAAAATCTG 5460 

CAAACACATT TAAATTCACA AATCCAAACA ACAATCCACT AATTATTAAA CATTTTAGAC 5520 

ATTGTTAATT CTCCTTGTTT GAACTGATTT ATTTTTAACA AAGATTATCA AACTTAAATT 5580 

TATATTAAAT GGAAAAAAAC AGTTCTATTT TATAATAGTT GAATTTATTA TTATAAAAAC 5640 

ATATTTTTAT ATCAAACAAA TCATTCAAGC TTATTAAAAT TTCTGCATAT CAAAAACCAA 5700 

TGAACGATCT CTAAATTAAC AGAGACAATT TTTAATAGAG AAAAACTCTC GCCCCACCTA 5760 

AAAGACAATA GTTTTACACA AGCTAACTAT TTAATGCTTT ACCTGTCATA TTTAATCTAA 5820 

AAGAAAATAC TAGATCATCA ATCCATGTTA TAAATGAAGC CTTATGCACA CCAAAAATAT 5880 
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CACATTTGCT TGTGTTTTAA ACAAAGTTTT TTAATAACAA 
CGTTCAAACT GTCAAAGTTT TCAAGCTTGA AAATAACCAA 
AAGGTGATGA ACTTCATTTG GTAGGCATTA CTAGTGCAAG 
GAAAATAAAG TCGAGCTCAA AAATCGTCSCT TTTAGCTTCC 
ACCAATATAC TTATTCTCCC CTTGACAAAA AAATCAAATG 
TTTGGTACTT ACGTGGAAAA TACTAAAAAC AAAGAAGAAG 
TAGAATTTTG AGAATATCAT AAAAAACTTC AAGCCAATAA 
CTGGGAATAT GGAAAAAACA GGAAATTATG TTGACAAGCT 
ATAAAGAATT ATTTGCTATT TACATCGAAA GAAACAATGC 
TAAATAAGAA CAATAAAACT CCCATTAGCT AAAAATAGAT 
GAACTGGTGT TTAGAAAACA CTTGTCCTGA ATTCTTGACC 
AACACTTACA AGAAGAGCCC TGGTAAAAGC TTTTTGGAAT 
ATAATAGAAG TCTTCCTGAT AATTATTTTG TAAAAAAATA 
GATCTTAATT TTCAAGGTGA GTGAATCAGC AAGATTAGCC 
TGGTTGGCAT TGATTAACAG ATACCACTAG ATTTTTGATC 
TCACATGAGT AACAAACATT TATTTATAGA TTTATAGTAT 
T^GACCTAAA AACACCTGCT GCTTATGTTT TTACAGATAT 
ATGACGATTT TCAAATTCAA CTGAAAAAAA CTCTCTTTTG 
TTTAACAACA AGCTTTGCTT AAACTGTTTG TCAATAAAAT 
AT4CACCAAG . CAACAAGTTT ACATGTATTT AGAATGTTTT. 
ATAAAGCTGG CAACCCGGCA TAAGACATTA TGAACTACTA 
AAAAATAAAT TCTTAATTTA TCCTGTGATA GCCTTTTAGA 
TTACTATGTT AACTATAAAC ACTTTTGAAA AAGGTCTTTG 
TATTTTATTT TAAACCACTA TTTCTATAAT CTTTGACTTA 
TAATAAAATA TTTAGTTAGG TATTGAAATT AATCAAATAT 
TTATTGATAA AAATACACTG AACATGGAGA TTAAAAATGA 
T^CCACCAAA CCAATAAAAA TAAACTACTT GGTAAAATCT 
TCAGTAATCA ATTACTTAAA TAAAGAATTT AAAAAAAAAT 
GAACACTTTA CTTCTAAAAA AGTAAAAGAA CTTCGAGTTC 
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TAAGAAGAAT AATAAGAATG 5940 

ATCTTGGTTT AGCAAAAATA 6000 

ACCAAGCAAT AATATCTAGA 6060 

TTATAGAGGA TACTTTTTTG 6120 

TAAAGGTGTT AAAACTTTAT 6180 

GCACTTGGGT GATAAATGAC 6240 

TATCAAATTT TGATTTGGTG 6300 

TTAAGAACCT ATTGTTAAGA 6360 

TAATAAAAAA CATTGTCCTT 6420 

GATTATCTCA AAAATTTAGT . 6480 

ACCGAATTTA CTAAGAAAGA 6540 

ACCAAAATTT TGCATTCCAA 6600 

GACATGATAT TGACAATAGC 6660 

TCATTCATTC ACTGTAATGT 6720 

AACATTATTG ATCTTGATGA 6780 

ACAGATTGCA AAGAAAAAAA 6840 

GATATTTAGA AGAAAAGTTG 6900 
ACAGTCAGGT TTTAAACAAT . 6960 

ATTTGAATTT TTAAACAAAA 7020 
TTTTGCAGTC, TTTAAAATGA . . .7080 

TTTCTAAAAT TAAAAATTAT 7140 

TCCTTTTTCA AATTTTAAAT 7200 

GCTTTTTCCT ATAGTCTTTT 7260 

AAACTGTGAT TAGCTAAAAA 7320 

TTTGAATATA ATTAAAGCAA 7380 

AACCAGCCAT ATCTAATCAT 7440 

GTAGACTGAA AAAAATTATT 7500 

ATAATACCTC AATTAATAAA 75^0 

ATCATCAAGG AGATATCCTT 7620 
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CGCGTACTAA ACTCAAATATTTCATAGAGAA AACAAAAAAG AAACCACAAT^AATACTCTA 7680 

AGACTAGATT TAAAATTTTT GGTTAAGCTA AAAGCATTAG AAAAAAGAAT ACTAACATTT 7740 

TCAAATAGCT TCGGAGAATT TAAAGGAAAG CTTTGTATAT ATAAAGTGTC GCCTATTGCA 7800 

TATAAATTGA TTT^TGCATA TTTTAATAAC ACTAAAATAG ACTTACTTAA AAAAGTAAAG 7860 

GT^GAGAAAG AATCTTTTAA GCCTAAAAAT ATCACTGAAA ATATCACTGT ATATAATAAA 7920 

CAATATATAA ATATATATAA TAAGAA-TTCT ATAGAAAACT CTTTCTTTAA AAGAATTAAA 7980 

TCAATAATTT TCAATGCAAA AGAACCAACT AAATCATTAA AAAATACTTT ATTAAACTAT 8040 

AAAGATTTTA AAAATTATCT AAAATATGAT TATGAGACAA AAGATATTAA AGAGTTTTTC 8100 

TTATCTAAGC TAAGTCTTTA TAAACATAAA ATTCACTTTA TGAGGAAAAC CGCACCCTAT 8160 

AAAACTGATT TTTACACTCT TGCAGGAGAA TTTAAAGATA CTTATACTAC TAAATGGAAG 8220 

GTAAATAAAA TAACTAGCTT TTCAGGACAT GCTAGGATAA TAGCCAATAA TATTCTGGTT . 8280 

AACACTTTAA AAAAAGGATT AAAATTTGAG TAAATTACTT GAAAAACTAA AACAAAAAAA 8340 

AACTTTAATG AAAATTGACA ATATTTTAAT TAAAAAAGAT ATTTTTAGCA AAATAGAAGA 8400 

AATAGATGGA AAAAAAGTAT ACTATACGAA AATATTTAAA CATTTAATTG ATTTTAAAGT 8460 

TACTAACAAA GAACAAAGAT TAAGACTTGT ATTCCAAGAA TTTAATAATA ACAATAAAGA 8520 

TTATTATTTT TTTAATCTTT TTTCATTGGG AAAAAATGAT AAATTTTTGG GAATAAAATA 8580 

TGGATGGGAT TACCTTGAAA AACCCTTCTT TCTTAAAAAA GAAGACAATA AAATTTATGC 8640 

AATAAAGAAA CTCTATTATA TAGAGTTTAG GTTTAAAAAA GGATCCGTCA AGTCTTACAT 8700 

ATTATCTTTA AGAACTTTGT TGAGAAAAAA TGAAAAAGAA AGCACTGAGT ATTATCAGTT 8760 

TACGCTAAAT CATCTAGAAA AAATGGAAAG TAAAGTATAC AAATTTTACA ATAAAAAATC 8820 

ACCGGATGGA GGAATTTTAA AAAAATGGAT ATTT^AAAAAT CAGATATTAT AACAATGGCT 8880 

TCAATTAAGG GAGGAGTCGG AAAAAGTGTG CTTTCTATAC TTTTTTCTTA TGTATTAAAG 8940 

GAATTGGGCA AAAAGGTGCT TCTAATTGAT TTAGATCCAC AAAATTCTTT AACTTCTTAT 9000 

TTTAATAGAT ATATTTCAAA TATTGAAAAA TATAATACAT ATAGTATGTT AAAAGGAGAT 9060 

TTCCATTTTA ATGAATGCAT TAAAAAAATT GATGATTATA TATCTATAAT CCCCTCTCAC 9120 

CCCATTTTGG GAAAATTTAA TTCGGAAGCC ATTGATTACA AAGAAGTTAT TTTAGAACAT 9180 

CATTTAAATG AAAATATGCA AAACTATAAT TTTGATTATG TTTTATTAGA TACTCCTCCT 9240 

AGTTTAGATT TTCTTTTAAA GAATGCCTTG AATGTTGCGG ATTATATTGT GATTCCAGTT >",9300 

CAGGTAGAAA TATGGTCAAT AGAAAGTTTT ACTATTTTGA TTAACGCAGT TAATGATATT 93 60 

ACAAAATTTA GAAAGAAAAT ATATAATATT TCTATTGTGG AAAACCAGTT TATAAAAAAT 9420 
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AGAAACACGA 
GGCAAGATCC 
AAAAAAGAAA 
TTGGCATTTT 
TTTTACTAAA 
AGGTAACTTT 
ATCAAGATAA 
AATCCGATAT 
AACTTTATAA 
CTAGAAGCCA 
CTATTGAAAA 
GCTTGTCAGA 
CCCAAAATAA 

' AAGATATCAA 
TATGAGATCT 
CTTGATTAAA 
GTGTTCAGTA 
AAAATAATAA 
AACAAAAGAT 
CTCATTAAAT 
TCAACAATAA 
TCAACTTTAA 
TATTTTTTAT 
AAATAAATCG 
TAATATCATA 
CTTTAAGCAC 

.-. ATTTATTTTT 
' ^TTGGATTT 
TTTATAAAGT 
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TAAAAGAAGT GGAGGACTTG 
ATTTTTCAAA TAGTATAAAA 
TGTATTATAG AGAAATAAAA 
TACTAACTAT AAAGGTACTT 
AATTATCTAA AAATAGGAGA 
ATATAAAAGG GTTGAAATCT 
GGAATTGAGA AATTACAATG 
TAATAATAAA ATTCAAAGAA 
GTATGATGGC TTCAAAAGTT 
AGCTTATATG TATTTGAAAA 
AGTTAAAGAA ATGGGTTTTG 
GATATATAAA GAAAATATGG 
ATCTATTAGA ATTTTAATGA 
AAGAATCTAC TTTATTTTAG 
TATAATTGAG TATGAAAATT 
ATTGTATAAT ATATTATAAT 
GTAAAATATT TGCCCATAGG 
AGTATTTTCT ACTTACAATT 
TGTTAAAGTA TTCTCACGAG 
CTGATCAACC TTTTATCAGA 
TTCTTTCATA AATTTTATTA 
TGGCGATCTC TTATGTCGCA 
ATTGATAAAA ATACACAGAA 
CGTTATTTTT GATTTTTGAA 
TTTTATTTAA AAATAAGCTT 
ATAATAATAT CTATCTTTAT 
GTATTTATTT TAATTTTTTT 
TTACGCAACT TTTTTACTAT 
TAATCTCAAT AAATTTATTC 



888 
CTTTATAAAG 
GTTCTTATAA 
GATACTTTAA 
ATTTAGGGTT 
TAAAAATGAA 
CAACAGGCAA 
AGTTAAAAGA 
TGAAAATTTT 
TTAAACAGTT 
TTTATGAGAA 
TAGCTACATA 
TTAAAGAAAA 
AAGATGAAAA 
AGAAGCTAAT 
ATAAAAAAGA 
CAAACTAGGT 
GGGCTTTTTT 
TCTATAAAAT 
ATTAATCTTT 
TTTAATTTTT- 
TTTTTATCAA 
GAAAATAAAA 
ACACGTAACA 
ATCCGAATTT 
AATAAAATCT 
CTCAATAGCA 
ACTCTTAATT 
CCTAAGTTTA 
TAATTAGTAA 



AATATAGAGA 
ATGGACGATT 
AAAATATTTT 
GTCCGATATC 
GAAAAAAGAC 
AGAATTAAGT 
GCAGTTGAAA 
ATATGAAATT 
TATAGAATCT 
AGTTTTAGAA 
TAAAAATATA 
CCCAGAAGAA 
AGTTTATGAT 
TAAAGATAAA 
TAAAAAGATA 
TAGAGAGCTT 
TGTGCCTACT 
TTAGGTAGAT 
TATTAAGCAT 
AGGGTTTAGT 
ATTTTAATTC 
ATTTTAATGT 
GATTTACAGA 
TAGTTTTTGG 
ATAGAAATAA 
TTGTTGAGAT 
TAATAAAATC 
TTAAGCAAAA 
ACATTTTACC 



ATATATTAAA 
AGAGCCCTCT 
TTCTTTATAG 
GGACAGATAA 
AATAAAAAGC 
TTAGGCAATA 
TTAAATTTAA 
AAGCAAAAAG 
TATATAATTG 
GGGATTATTT 
CTAAAAAATA 
GGTGTTGGCA 
TTTTGCAAAA 
AAAAATATCT 
AAAGTGAGCT 
TTCTCTCTCC 
ATATATTAAA 
ATAAATTCAA 
TTATGCTTTT 
AGAATTTTTA 
AAGTAGCCTT 
TAATAAATTG 
TAAAAAGGAA 
TCAAAACGGG 
AATAAGATTA 
TTAAAAAACC 
AAACTTCAAA 
AAATATTAAC 
AATTACTCTA 



9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
.9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
1.0500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
111-00 
11160 
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GCATCATTTA 
CAAACAAAAT 
CTACTTAAGC 
TTTGAGCAAT 
ATTTGAAATC 
TTTAAATTTT 
TTTTTTTGGA 
TGTGCGCTGT 
ATTTTTATTT 
TACAATATTA 
TGTTTTCAAT 
ATAACGATGC 
ATACCTTATT 
AAATATCAAC 
TGTAAACAAG 
TGATGTTGGT 
AAGTTAAGTA 
AAGCATTTAT 
ATTGTATTTA 
ATTGTATTAC 
AATATTTATG 
CAATCCAGAT 
AGATGCAGAT 
AGAAAAAGCG 
TCAATATGGA 
AATATCTGAT 
ATTAAATGCT 
AAAAGTACTA 
TGTTCACTTA 
ACTTAAAAAT 



CTAATGACTT'^AATTATTA 
TCAGGCTTAC AAATAAATAC 
TTAAAAATAC GCCCTGAAAT 
CTTTCACAAG TTCTTTGATT 
AAAGAATTTT TATACGAATG 
TTAAGAATAT TGATTGATGC 
AAAGATGCGT TGACCATTAT 
TTGAATAGCA TTAAACTCTT 
TTTGCAGTTC TCTTTCTCCG 
TGTTAAGTAT ATATTTCAGC 
GATTCGTCAA ATTTAGTTTT 
TTGAAAATAT A7UVAAAGAAA 
TTTAATGTCA TTAAGAATGG 
AGCAGATGTT ATTTTAAATA 
TGTTTTTCTA GAGTAAATTT 
GTATGAATTT GTGTGAACCG 
ATAATTACAG CATTAAAGAT 
ATGGTTTAAT TTCAATAATG 
TTAAAAATGA TATTATATTG 
ATAATATTAT AGGATATAAA 
AAATATAATA CGATTATAAG 
TTTAACACAA ATAAGAAAAG 
TCTGATAAAA TAATAAAAAA 
AATGCAGATA GAGAAAAATA 
ATGTTGGCTG TTTTTGGAGG 
ACAGGTAGTG AGAGATCTAT 
ATTGAAACTA ATGAATTAAA 
GAAATATTTA GCCTATTTAA 
TATTCCAAAA AAGATACTCT 
TTGTTTGAAA AATTATTATC 



^GG^^-fi 
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TGGTTTACAA TATCTACGG(j! ^'rATCTTCTG 11220 

TCTTCGAAAG TAATTTCACA CTTCAGCAGG 11280 

CACCTTAAAT TCTTGTTAAT AATTTCATAT 11340 

TCGAAAGAAT TGTAATTATT AGATCTTTAA 11400 

AATTGATTTG TTTACATGAA ATCCTAGATT 11460 

TAATTTAATT ATATTTGAAT TTCTTTTTGG " 11520 

TAAGATTTTT TCTTTGAAAT GAATAGTTTT 11580 

AAAAAATGTA TCAAGCAGCT AAAGTCTTAT 11640 

CATTCACCTA TGAAATAATA TAATAATAAA 11700 

ATCATCTATA AAAATAATTT TAGGAAAGCT 117 60 

ATAGATATTT GAGCAAGGAA TTATTTAGAT 11820 

ACCCAAAATA CAAATTTATA AATTTTATAA 11880 

ATTGCTTTTA TTATTCTTTT GTTACTTCTA 11940 

GTTATATTTT TGCACCTTGT GAAAAGCAGA 12000 

TTTATGATAA GGGGGTACTG CTACACTATG 12060 

CTATTTAAAA TTAAATAATA AGCTTTTATA 12120 

AGATTATTGC CTTGCTATAA AGAATACATA 12180 

CAGTACACCA GCAAATAAAT ACAATATTAA 12240 

ATATTAGATT GATATATTCA ATTTTAATAT 12300 

ATAATACAAT GTAAAATTTT AAGTAAGGAG 12360 

CATATTTGTT TGTTTGTTTT TAACTGCTTG 12420 

AACTCTAAGT AAGGGGATAA TTTCAAATCA 12480 

TAAATTACTT GATGATTTAA TAAATTTAAT 12540 

TGTAAAAAAA ATGGAAGAAG AACCTTCGGA 12600 

TATGTATTGG GCAGAATCAC CACGGGAATT 12 6 60 

TAGGTATAGA AGGCGTGTTT ATAGTATTTT 12720 

GAAATTTTCA GAAATTAGAA TACTGTCAAT 12780 

TCTATTTGGA AGTACTCTTG ATGATGTGGT 12840 

AGGTAAACTA GATATTTCAA ATTTAAAAAG 12900 

TATAAAAACA ATCGTTTCAA AGATGTCAAA 12960 
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ACGTCTTTTA 
TGGATCTTAT 
GCTGAAAAGC 
AGTCAATATT 

- TCTCCTAATA 
CATCTTTATC 
CATCATCAGT 
ATTTTGAATT 
AGACAGGCCC 
TTTTGTATTA 
ATAAGAGGAT 
AAGGAAATTT 
ATTAATGCAA 
GAACGTTCTT 
GCGACAATTA 
TAAAGGATTG 
TTAAATTAAT 
ATGGAATAAG 
GCCCCGGCAG 

„ AAG.TTATTTC 
GCACTGCATT 
CTTTAAGTTU^ 
TGTTTTATAT 
CATACTGCAC 
CCCCTCCTAT 
ATTTTGATTT 
GTTTTTATTT 
ATCTAAAAAT 
TTATCAATTA 
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TTGGATTATC 
GTGGTTGCAC 
GAGATAATTT 
GGCATCCTTT 
TCAGTTAGTA 
AGCATCCACA 
CAAGTTTTGC 
ACATGGTAAC 
CGTATGAGGT 
TTATTTGTAA 
AAATAATGAA 
ATCTAGCTAG 
TATTAGATGA 
TTTTTATTCC 
GCGATCCTCA 
AAAAATCTAA 
TAGGAGCTAT 
GAATTAAGGT 
ATGTCTTCCG 
TATTA^T-tTTT 
TCTAATTTCC 
CGCAACAAGG 
ATAATGAGCA 
AGTGCACATA 
TCTGTAAATA 
TTAGTGCTAA 
AAGGCAGGTC 
TTTAACAATA 
CCTAACATGG 



AAAATAATGA 
TTTCCAATCA 
TAATATATAC 
CTCTCGGCAG 
TCAATTGGAT 
ATAATCACAT 
ATTTACAATT 
AAAATTAAAA 
TAAATTTATG 
TT^TAGATAT 
TTTGTTTAAA 
TATAACGATT 
GTATATATTG 
ATCAAACTTT 
TGAAATAGTA 
TCAAGAAAGT 
TAATTATATG 
GGTTGGGGGC 
GGTTTAAAAA 
TGATTTAGAA 
TCGTCAAAAT 
TATTCCCAAA 
GCACTTCCTT 
CAAGCAGCCC 
TCGCAAGCCT 
TTGTCCAATA 
TCTCTGTTCT 
TTTTGTTCTA 
CATTGACTAT 



890 
AAATTTTATA 
AATTCAAGAA 
CCTTTAAAGG 
CAGAACTAAA 
TATTATCGGC 
TTAATATCTA 
TTTATAGATT 
AAGATCATGA 
TATTTTATTT 
ACTATAGTAT 
ATTGAAGCTA 
GCAAATGGTC 
CCAGGATTTA 
ACGCATTTGG 
AATGTTTTTT 
TATAGAAAGA 
TCTAAGGAAG 
AACTGTCCCG 
ATCTAAAAAG 
ATATTAGTTT 
CACCTACTAT 
TTATCTCTTT 
TTAGTTCAAG 
TTTTGCTATC 
AATAACGCAC 
TATAGACTTA 
TTAATATAGT 
TATATTTTTT 
ATTAGGAATT 



AAAACAGATA 
AAATATAATG 
GTATATATAT 
TGCTTCACCA 
ATCATTTAGC 
CTCACTACTA 
TAAATAAATA 
ATATAAAGAA 
AATAAATTAT 
GTTATGAATA 
ATTATATTGA 
ATATTGTGAG 
TTGATGCACA 
TAGTTCAACA 
TCCGCATTTA 
GTATGAAAGG 
GTTTAAGGTT 
AAGTAAAGCT 
TTTTCATTAG 
ATTAAAATAT 
TTTCTTATTT 
ATGGAATACT 
TTCGTTAAGC 
TTTTTTAAAA 
AATCCCACAT 
TATTATTATT 
GAACATTAAT 
TTTACAAAAA 
TACAAACTAA 



ACGCCAAGCT 
AAGCAGAAAG 
CCACTTTCTG 
CCACCAACGC 
ACACCATTAT 
ACCTTGGTGG 
ACCTTATTAC 
ATAAAAGCTA 
TTTCAACATA 
AAAAGTTTTT 
TATCCTTAAT 
CATGACAAAA 
TATACATATA 
TAGCACTGTG 
AAAAAGGCAG 
TTTTTTATTG 
TATTGCTATA 
TGTAGATTAT 
ATAAAGTAAG 
TTAGACGCAA 
GAAAGTTTTT 
ACAAGCTTCA 
ATTTTCAAAT 
GTATGAGTGG 
GTTTTTTGTA 
TTATTTTAAA 
TCATTTTTTT 
CGATTTT^AAA 
TTTTTTAGTT 



13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
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GTTAATCTAT ATTTTATTTA^WtTTTAGAT ATGCTGCTTT GGGAAGTGTC tIcAATGTCTA 14760 

CGTTAATTAT CCTAGTTCCA TTATTGGGAG TAAATTCTAG TAATAAATGA ATATGATCTT 14820 

TATCGTGGCT GAATTCATTA AGGGCTATTT TCTACAAAAG CATATATTAA GCACTATTTG 14880 

GTTTGGTAAA GAAAAAATGA ACGCTCACTA TTTATGCATC TTAACCTATA ATTTCATAGA 14940 

AATGGATGGG CGATAAAATA TAATTAAATA ATACTTAAGC CCCQCAAGAT CTTGAATTAA 15000 

ATTATTATAT TTATCTTTTA TAACACTTAA ATTACCAGGT TTTGTCCATA TGACATAGCC 15060 

TCCTCCTACA ATTTTCAAGC CTCTCCTTCT TTTATTTGGT TTAAACCAGA TTCTTCATCT 15120 

CAACAAAATA AATATTGTTA TTATCTTCTT AAAGGCTCTC TTAATGTAGC TTAAAGCCCA 15180 

AAATTCAACT TAATAATTTG AAGAAAATAT AGGGTTAAAA GCTTAAGTCA ATTTCTGAAG 15240 

GATCAAGTGT TAATTTTAAG AAAAATAGAG CTGGTTTCCC TAAAATTAGA TTAAAAGAAT 15300 

CTTTAAAAGG GTTGAAATAT ATTAATTAAA ATAGCATAAT GATTTATGCT ATTTTAACCA 15360 

CCATTTTAGT TGCTTTGCAA GTTAAAAGGC GGTAGTATGT GTTGATGTGG TTTAATTACG 15420 

GCTATACTAT ATAAATGCTA CTACTAATTT TTTATATAAT CTTCCAATAT TCTTTTTTAT 15480 

CATTTTGAAT GAAGTTATTT AAATATAAAT ATTTATAGGA TTTATTGTTT TATCATTATA 15540 

AGGGTATACT AGTCCTAACT ATGCTAATAA TTGTCCTACG TGCTGATTTT GTTAAGGTTT 15600 

TCGTTGTTAT GCCATACAAA CTTCATCTGA ACTTGTAAAT TTAATAGCAC TCACTATCTT 15660 

TTAATTTTTC TTTTTTTATA TTTTTAAGAA TTCTTCCAGC GTCTTTTATT CTAGAAGAAA 15720 

CTCTTGGTTA TATTTATACA GTTATTTGCT CAAATATCCA TAGAACTAAA TTTTGCGAGT 15780 

TCTTAAAAAT AAATTTTCCT AAAATTATTT TTGTAGATAA TACTGAAATA TTTGAAATGC 15840 

TCAATAAATT CGGAACAGAA CTTATTAATT CTCATTTACT AAAAGTTATT TCAAATTAGA 15900 

CAATAATATT GAAAAACGTT TTTTAACCTT GGATAAAGAT AAAAAACAAA ATAAAATTAT 15960 

AGAAAAAATT TTTTACAAAG AAAAAACAAA TGAGCTTTAC CATAGCTTTT GACATTTTAT 16020 

ATTACAAGAG CTGCTTGAAC TAAATTTTTG GACTTGTTTC TTTTACAGAA GATCCTATAA 16080 

TATCTTGAAA TATTCTATAA ATTATTTACA ACTTTAAAGT TTTAGAATCT TTAAGACAAT 16140 

AACCATAAAA AATCTATTCA TAAGTATCCC ATTTTTACAG CAATATACCT TGAAGTGTTG 16200 

AAAAGCTTTA ACTATCGATT TTTTTAATAT CTTAGCACAA ATCTATGTAC TATTACTAAT 16260 

ATAAGAGAGT CTTCTTTTAA AGAAGACTCT AATTTTAAAT ATTAATATAT TTATATATTT 16320 

TTTTTCCATT TTAA6ACTTA CrpTAAAGCAT TTTTTGCCTG TTCAACAACT TCTTTTATAA 16380 

AGCTTCTTCT TCCTATTGCC TCACCTTTTT TAGAAGAATA ATTTTCTAAG CACCTTAAAG 16440 

CATCCTCTGC TCTATTTAAA GCCTTTTTAG ATAATTGTGA TGCTGCCCTA TTTTTACTTT 16500 
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TTTCCAATCT TTTAATAATA CCTTCTTTTA AGCTTTCCTT AGCTTCATCA AAAAAGAAAG 16560 

CGGCAGATCT TATCTCTTGT TCTGCAGTAT CAATGCAACC CATAATTTTA TCAAGTTCGT 16620 

CTCCTATCTT TAAATTATTT TGCAATTGTA CTAGTTCCCT TATTTTATTT CTATTATTAT 16680 

GAGAATTTTT CATTAGTGAT ATTTTTTTAT TCTGAATCTT AGTTATCACA TCATAAAAAT 16740 

CACTTCTTAT TAAAGTATAT TCATGTTTAA GTGAGCACAC ATTCTCAATT AACTCGGGAA 16800 

ATCCAGATTC TCCAATAAGA TTCTCTATAT CTTTAATTGC TTTATCCGCT TGCTTTTCTT 16860 

CCTCAGTAGA AGGGAAAAAA TCCTCTTCTT TTATCTCTTT TTTTTGATTA TGCTCAATTG 16920 

AAATGGTTGG TATACCAATC CTATTATTAG ATTCTCCTAA AGACACCGCA GATTCTACGG 16980 

AGGGCGCCAC TACAGGTTCT AAGGGGAGGG TGGTCACGTC TAAACCCTTG TCTTTCAATT 17040 

TTTCCGAATT TTTAATAAAA TCTTTTTTTT CTTTTTTATT TCCATATAAA TTATTAATAG 17100 

CATTTTCTTG AACGCCATTT AAAGCTTCTT TTATATCATT GTTATTTTTT TGTTCCTCTT 17160 
TATTACCAGA TAATTTAGAA TTTAGATTAC AAGACATCAA TCCTATCGTT AACAATGTAT ' 17220 

ATAAAAACAT TTTTTTTTTC ATAAAAATAC TCTCCTTTCC CTTAATCAAG AATATATATT 17280 

ACAAATAATT ATTCTTAATT AATACTAATT ATTAATTAAG ATTATATATC ATTTTGTTTG 17340 

AATTTCAATA AAATATAAAT AAAATTAATT ATATTTTATA CTTTTTTGCT TATTAATCAT 17400 

TTGGAGAATA TATGATAATC TCTGAACTAC TATTTTGCTT TAAGAAGAAA TTAATAAATT 17460 

GTTTAAAACT AGAAAAATTT TCATATTTAT AAATTTTTTT GCTTAATTTC ATATAGAATT 17520 

CATTCTTTGA ATTTTATTAT TAATATTGGA CTAAAGCTTG ATAAAAAAAT AATATCAAAT 17580 

CAAAAATTTT AGATCCTATA CCTGTAATAT TAAGAAATCC TTTTTATGAT GTAAAATTAA 17640 

AAAACAATAA TTTGAATATA TTAGATTTAG CTA^TGACTA TAAAAAAATA..AAAAATGAAT 17700 

TAATAAAGAA AAAAAGTTTA ACAATGCTGA ATTTTATTTA TATTTTAACC CATTAAACTT 17760 

TATAAAGGAT TTATCAAAAT CAATTTTTAG CTTTCTAATA TTATTTTTAT TAATAATAAT 17820 
TCTTTAATGA ATTCTCTTAT TTTGCCCAAA TTTTAATTCA AAAAGCTTTC CAGTTTTAAT . 17880 

AATAATCTTT TCTGGAAGCA GAAGAGAAAA GTTCTAATGT TAATAAATTG TATTCTTTTA 17940 

CAAACCCTAT TTTAGGTAGT TTTATATAAC CATTTTCTAT TCTTATTGAG TTTTTTTGAT 18000 

TATTAGTTCT ATAAGTTTGC CTATTTTTCT TACTTTTATA CTTAGGAAAT CCTTGCACTC 18060 

TATTTCCTTT TTTAATTTCT CTAAAAAAAT TACTATACGC AAAATTTAAG TCGATCCACG 18120 

CGCTACAAAG AGCCAAACTA TCAACTTCCT TTAAAAAAGG AAATTCTTCT TTATATTTAC 1818i) 

TTGGATAGGT AATAAGATTT. TGTCTATTAT TTTTATAATA ATCTTTCTTA TCACTTAACA 18240 
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TTTTGTTATA CAAAAATCTT 




i 893 I 

Iacatccaa ATACTTTTGA AAAATATTTT 




'TTGATTGG 



18300 



TGTTGGGATA TATTCTGCAC TTATAAGCTT TATTAGCATT CATTATTTTT 



TATAATTAT 



18359 



(2) INFORMATION FOR SEQ ID NO: 9: 

(i) SEQUEa^CE CHARACTERISTICS: 

(A) LENGTH- 14752 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9: 

GCAGGTCGAC TCTAGAGGAT CCCCTTACTT ATAATAGCTA TATACTACGA AATATACAAA 60 

AGAAAAATAT ATAAATGCCG TTTATATAAA ATTACTTGGA TTAGAAAAAC AGGGAAAATT 120. 

ATTTCCTATA AACCATCAAA AAATATAAAA ACTTTCAAAA AGTATGAGGG AAAAAGTATT 180 

AATTTACATC CCCCCAAAAG AAAAAATTTG AAAATATTTT ATAACACCAA ACTTTTAAAA 240 

AGTAACAACC CTAACAAATA TTTTCTCAAG TGCAATCTAT T/U^AATTGGT CAAAATGCCA 300 

TAACGTTTGA AGAGCTTGCA ATCAAATATA TAAAAATCCA ATAATATTGC CTAGCAAATC 360 

TTATTATTTT AAAATTTTAA AAAAACAAAT CCTAACTATG TCTTAAATCT GGATCAATAT 420 

AATTTATTTA AAACATTAAA TAAAGATTAT ATAGATAATA TACTTATTAT TTTTAATTCA 480 

AAGCCTAGAA GAGAAAAAAA GAATGCCCAT TAAATGTAAC AAGATAAGTA AAAAAGAGGA 540 

AACAAAAAAA TTTTTTGTGT GGAAATTTTT CAAAAAAATA ACATAGTTAA AAAGGCATTT 600 

AAAAACACTC TCAAATATTA AAATTATAAC ATGCATTTAT ATAAATGCTA CAGAACTATC 660 

GATAAACAAA AATGGAATTT TTTAAAAATT GAGATAGACT AAAATTGAAG GAGAATTAAA 720 

ATTTTTATGA CAGCAATAAT CGTGTATTCA TGCTTGACTA TGTGTGTAAT ATATTTTCAC 780 

TTGCAACTAA AAACATTTTT CACAAAATTA ATCAGATTTT GTAAATU^TG TTTTGATATT 840 

TTTTTATTAT TAATAGAAAT GTTAAAATTA ATTTTTTATC TATTAATTAT TAATAATAAG 900 

TTTTATATAT TTATTATAAT ATCAATAGCT TTAATTACAA TCAATACAAT GATTTAACTT 960 

ATTGTATTGA TTGTAATTAA GCCAAATGTA TCCAACAAGC TAACTACTAT TTCTAAATCA 1020 

AAGATCATTA AAATAACTTA TTGCTTCATC TCATATGATA ACTTTTTAAA TTATTTTTTA 1080 

TTAAGACCGG CCATCCGCCA AAACATAATC CCCCAAACCT TACTTTAGGA AGTTCTTACC 1140 

-TTGGTTTTTT ATTTCTTTAT AAAAAGAAAG TCTTAAGATT TAAAATTGCA TTTAAATCTC 1200 

TATCATACAT ATTGAAACTT TACTAAAACA TTCCTTTTTG TATAAAATTA ATTGATTAAA 1260 

TTCCCTATCA TTATGTTTTT ATAATTGACT AAAAAGTAAT AAGACAATTT ACATAAAAAG 1320 
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TCTTTTCTTT GAATTTAATT TAAACTTTTC TTATACAAAT TAGCAACCCT TAATCTAGAT 1380 

TTAGCTCTAT TAATAGCGCC CTTTGTCTTT TTAATAGTTT TCTTCCAGTA TTTTTAAGTT 1440 

TACTTTTATT TTTTATAAAT ATTTAGAATG ATTGTTTTTT TACTTTCACG ACTCTTTTTT 1500 

ATTATTTTTT TTATTGTTAT TTTTAATATT TAAGCTCTCA ACTACTACTG AAATAT7UVTA 1560 

■TTTATTATCG GTATTTTTTC TACTACTAAA TTTTTAATAA CTTTATTATT ATAATGATCC 1620 

TATGTAGACA TAACTTTACA AATCCTATTT TAGATAAGCT TTATATTCAT TTTCTATTCT 1680 

TATTGGGTTT TTCATTTTAT ATTTAGGAAA TCCTTACGTT TTGCTTCCCT TTTTAATTTA 1740 

TCTAAAAAAT TATTATCTGC GAGGCTTTAA TCAATCCATG CACAAAAAAG AGTTAAAGTA 1800 

TTAATCTCCT TTAAGAGTGA AAATTTATTT TTATATTTGC CTAGATTAAT GCTAAAACTT 1860 

TTCTTGTTTT TTTATAAGAA TCTTTCCTAT CACTTAACAT TTTGTCATAC AAAAATCTTA 1920 

CAAATCTAAA TACTTTTAAA AATTTTTTTG ATTAGTGTTA GAATATATTG- TGTTTTTACA 1980 

AACTTTATCG GCACTTATAT ACTCTATTAT TTTATAATAA TTACTTAGTG TATATAGAAA 2040 

TGAGATAGCT TTTAATAATC ACTGCATATA TTTAGTTAAT TATCCCCCCC CCCCGAGTAC 2100 

TAGTTACTAA CCATAGACAC AAATGATGAG CTTATGCCCT GTCTCACAAA ATAATACTTT 2160 

TATATTCCTT ATGGAAAATA ACCATTAATG AATTAAATTG CAATAAAGAT CACATTGCCA 2220 

ATATTCAATC TTCTAAATTC ATCAATAATT TAATACAATA TCTTCATCAA AGCTTATAAG 2280 

AAAAAATATT CTAATTATTT ATGCATTGCT GAAAATCTTA TTfTTAATCT AAAAACTACT 2340 

GACTTATTTA TACTAGAGAG AAAGTTTTTC CGATATGATC AAAAAGCATA TTCGGAATCA 2400 

AAATAAATCC ATTTACTAAC AAATTCATAT CTACCTAAAT TTCACAGAAA TCATAGGTAG 2460 

ATAATTCTTT ATTATTTTTT... TGTTAATVAArT .TTAAATAAC A AAATTATTAT TTTTTAGAAG 25:20. 

CTTCTATATA TTCCATAATT AAAGTTCTTA TAAAACCAGA AGCTGTTAAT CCCTTTTTGT 2580 

CTAAAATAGA ATAAAATTCA ATCCAATATT CATATTTCAG TCCTACACTT ATTTGCTTGA 2640 

TCGTCATTTT TGATCTAATA GGCTTAACAT TTGGAATGTT ATTGCTAATA ACATCATTAT 2700 

CACGAAAAGC AAATTTAGAT TTGCTAACAT TTTGTTTAAT AATTTCTTCT AAATTAACCT 2760 

GTTTGCTTAT AGGCATAAAG CATCTCCCAA TCTTGAAAGT TCTAAGACAG ATCTACTCTC 2820 

CGGATAATAA TCAAAAATCG ACTTCTTATA TAGCTGAGAT TCTGCTATTT TAGCATCTTG 2880 

TCCAACCTCA TAAAGATCAT ATCCAAAAGT TTTAAATTGC CTTAGATGCA AATTATGTCT 2940 

TTTAAAACTT TTATTAAGCA TATTGCAAAT AATCTTCTCA TGTTTAACCT TTTTTCTATA 300-0 

AGATTTTAAC AAAGACTCAA ACTCTTCTTT AAAAATATTA ATTCCTTCAA GGCTTAAAAA 3060 
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TTCTGGGGTC AGTGGAGTAA ^SaCTTCACA CATTGCAAGA ATAATTCTTC^CTCCCAAAG 3120 

CTCAAAACTG GGAGATAAAT CAAAAATTGC AAATTCAAAT CCCAATTTCT CCAATTCCAA 3180 

ACAAAAATCA TCTATCAAAT ATGGAAAATC TTGCAATTCA TGTTGCACAT CTCTTCTAAA 3240 

AGTTCCACTC GGCACACATG GCAAAATATA AAAATTTTTT TGTATTTGTC TTACTACTTG 3300 

ATCTACATCC ATCTTCTTCA AAAGAAAATC TTTAATATCC AGCTTAAGAA TTTCATGATT 3360 
AAGAAACCAT GTAGAAGAAC TTGCTTGCTG TATATCACAA TCAAGTAATA TAACTTTTTT - 3420 

TGTTTTAGAT AAATAACTTG CAATATTTCC GCTTAAGGTA GTTTTCCCAA CACCACCTTT 3480 

TTGAATATGA AATGCTATTT TTTTCATACA AACTTCCTTT TAATTATTTT ATATCACATA 3540 

TTAATTATTT TATATCACAT ATTAATTATT TTATATCACA TATTAATTAT TTTATATCAC 3600 

ATATTAATTA TTTTATATCA CATATTAATT ATTTTATATC ACATATTAAT TATTTTATAT 3660 

CACATATTAA TTATTTTATA TCACATATTA ATTACTTTAA TCTCTACCTA TGAAGCCCCT 3720 . 

TTCACAAAAT TTTTTAATGA ATTAGATCTG ATGTGGCCTT AAAAGCTAGC AAACTACTAT 3780 

CTCTATATTC ACGGCTTTTG TCTCATTCTA CGATAACTTT TTAGTTCTTT TTATATCTTA 3 840 

TTTTCACACC AATAGCATGA TTAACAAGCC TAAATTCGGA AAATTCCTGT CTTAGCTTTT 3900 

ATTTCTTTAT AGCAATAAAA CTTAAGATTT AGAATTGCAT TTATATCTTT ATTATACAAA 3960 

ACGCTGTAAG TTTACCTAGC ACCACTTAAT TTTAGAATTG TATTTTTAAC ACCACAATTA 4020 

CAAATAGCTT GCTTGATGAA AAATATATAC CTACTTTATA CAAAAAGGAT CCATACCATT 4080 

CTGATTTATA CTATAATCGT CTTACAAGTT TATAACATCC TAAATTATTA ATACTTTACC 4140 

CAAACATTCA CATATCTTTA ATTAATAAGT TCTCTATTGC TATATTTTTA TAAATAACTA 4200 

TAAAGCAAAA AATACCTTGT GTAAAAAGGT TTTTTGATTT ACAATTTTCT CATGTAACTT 4260 
AGTAATTCTT AATATAGATT TAGCTCCATT AATAGAAGTT TTTTGTTTTT TTGATAATTT - 4320 

TTTTAGTATT CTTTAAGTTT ATTTTCGTTG TTTTTTTATT ATTAGCTTTA AAAGCTTGCT 4380 

TATTTTTCTT GCTCTTATGT TTAAGAAATC CTTGTGTTCT ATCCCTCTTT AAATTTCTCT 4440 

AAAAGAATTT ATATATA6AG CTTAAGTCAA TCCATGCATA CAAAAGGCCA AACTATAAAC 4500 

TTTTTTTAGC AATAGAAGCT CTTATTTATA TTTATTTGAA CAAGTAATAA GATTTTGCTT 4560 

ATTTTTTTTA ATAAAAATCT ATCTTGCCGC TTTAACACTG TATTATATAA AAATCCTACA 4620 

CATCTAAATA CTTTTAAAAA GTATTTCTTT. TGGTT6GTGT TAAAATATAT TCTGTACTTA 4680 

TAAATGCCAA CCTTCTCTTT GCCAAATAAT ACTTATTTTA TGTTCTTTAT AGAAAAAAGA 4740 

ACTTTTATTA AAAAAATTTA AATTATGATA AAAATAAAAT TCATTTATCA CCAGAATTTA 4800 

CTTACAATAT TTAACCTTCT AAATTAATTA ATAATCTAAA AACGGCACCT AAGCTATTGT 4860 
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CTTATCTATA TTAGAAGCCT CTACCGATAT 
ATCTATTTTA CAAACCTACC CCCCGCCCAA 
TCATTATTCT TTATTAAATT TATAAAAAGT 
ATAAATGGTT AAAGGTTAAA GATAAGTTAA 
TTAAAAATAT TTTTTTTATT TATACTATGT 
TAGTATTATA TTATATTAAT ATATTTTTT^ 
AACTATAATG AATATACAAT TGGGGGCATA 
GAAGCTAATT ATCGAGCAAA AATAAATGGC 
AGTTTAAAGA AAAAATATGA ACTTAATATT 
ACAAATATTG CAATGAATTG CATAAATACT 
CAAACCGGTG AAAATTACGA TTATGACACA 
CTTAAATATG GAACAAAAAT AATTGCCGCA 
ACCAACTTTA ATGAAAGCTA TTATGAATGG 
AATTATGAAC CAACTGCAGA AGAAATTAAA 
CCTTTAAAAC TCAA?VCATAG AAAAAAAAAC 
GCCATCAATA AAATTGAAGA TCAATCACAA 
AAAAAATTAA AAGGAAATCA TGGGGAAAAA 
TTAATTTTAT TTATTATTAT TAAATAATAT 
ATGTAAGGTA GAAAACGATC TACCAATAGT 
i^GATCGGGG GTAGGGACTT CTTTTTTAAA 
ATTAATAAGT TTATAGCAAA TAAGAAAAAT 
ATTTGCATTG TGAATATAAA ATTTTAACAA 
TCAAAGATTA TAG7LAACAAA TCCTCGATTT 
AGAACAGTAT TTACCAATAC ATGATCTAGC 
TATTTCTTTA TAAATAAGAC TTAAGATTTG 
CTACAACTGC CAAAAGGCCA ACTGGTTTCT 
TAATTACTAC ATAGTTTACT TAATAGGAAA 
TAACAACTTA ATTTATATAA TAATTATCTT 
TACTTTTCTT TTGCTATACA AAAATCTTAC 
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CATAAAAAGT ATATTCAGAG CTAAAAATAA 4920 

ATTTATTTTG AAATTTAGGC GGGCAATTCT 4980 

CCTAAGAAAT TTCTCTCTTA AGGACTTTTT 5040 

AATCTACAAC AGTTTAGAAA AAAAACAAAA 5100 

ATTAATTGAT ATATAATATC AATTAATACA 5160 

AGGATAAAAA TGCAAAAAGA AATAACAATA 5220 

AAAGGAACTT TpTTTGGAAA TTCTCAATAT 5280 

TTTATAATTG ACTTTTTTAA AATTCCCATA 5340 

AAAGCCCTTA GTGATCCTAA TTTTTCATCC 5400 

TTCAAGCTTA TAGTTGATAT TGTTAATATG 5460 

TTTATTACCA AAACAGACAC AGAAAAAATG 5520 

CTAGCAAGGC ACTTCGACGA ACAAAACAAA 5580 

GAAAAAGGCT GGATAGATAA AAAATGGATA 5640 

GAAATTCAAA TAATGAATCA AAAATTAAAT 5700 

CTTAATAACG GCCAAATAAG GCTTTTACAA 5760 

CAACAGGCTA CTAAATCAAA TAGCAAAACT 5820 

ACCAAAATTT AACATTTTAC TTAAAAGCGT 5880 

TTACAAAATT AAAAAAATAA AATATTATAT 5940 

CCCCAACACC CCTATTAATC CTCTCCAAAT 6000 
AAAATAAAAA CTAAAATATT TGGTGCCTAA _ 6060 

GAAAATCTAA AAAACATAAA TTAACTAAAA 6120 

TGCTTTAAGA TTTAAATTAC TATTTCTAAA 6180 

ATTTCATGGC AGCTTTCTAA ACTATTTAAA 6240 

CTTACTTAAG GCAGCTCCTG TCTTAGCTTT 6300 

GATTTGAATT TAGATTTCTA TCACTTAGAA 6360- 

CTTAATTTTA GAGTTGTATT TTTAATACCA 6420 

CATCTATCTG CTTTATGTAA ATAAAATCCA 6480 

GCGACTCTCT. ATACCACCAT AAACCACCAA 654.0 

AGATCTAAAT ACTTTTGAAA ATTTCTTTTG 6600 
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GGTTTAGAAT ATCAATAATT^StTTTCAAT TTTTATTTAA AAGAATGATA tPtAATTTAAT 6660 

GCATTATTTA GGGTTTATGA AATAATATTT TTGCATTTCT TATTCGTTTA TATTTCTTTA 6720 

TAAGAATATA TAATTTTGTT CGAATTCTGC TTTAAAAAAT GGTTAATTTA GAATATAATT 6780 

CTAATGGCTA AAATGCTAAA AATGGATATA AATTTGGACT AATTTTATTA TATTGAAAAA 6840 

CAAATTATCT GTATATACTA CAATAATGCT TAACTTTAAA TTTTTAAAAT GTGTTTACTT 6900 

GTGCTTTATG GTTTTTGTAA GGTTAATTTT AATAATCAAA TTTAGGGGAA AGAAATTTAT 6960 

GAATAGAAAA TTTGTTATTT CATTATTATT TATAATATTA. ACTTTTTTAT TAATATTGGG 7020 

TTGTGATTTA TCAATAAATA ACGATCGAAA CAAGATAGAT GGGGCTTCTC ATTTTAAAAA 7080 

GAAATATATG GATAATTTGA ATTATCAATG TTTAAGCAAA A7UVGAGTCTG AGGCTAAAAA 7140 

TTCTCAAATT AAACTGGATG AGAATAATAA TAAAAATCAT TTTTATTCTT CCAGAGTATC 7200 

TAATGTTTCA AATTACTATG ATAGAACTCA TATATCTTGC AAAAAAAATG ATTGATTTTT 7260 

TTTGAAAAAT AAAAGCATGC TTTGTTTACA ATCTGATTTT AAAAAATTTT AGTTTAGTTG 7320 

GTAAATATGA GTTTTTCAGT GTCTTTTTAA TAGAAATGCA TATATATATA TGAACTGTAA 73 80 

GAAAATATAT TAAATGTTCC TAAAGTAAAA AAATTCTTAG AATAGGGCCT ATATATAATA 7440 

ATACTTTTTA TATATGTAAA TAGCAATTAA TTTTGATTAA TTTTAATTTT GCTGATTCTT 7500 

TTAAAACCTT TACTGTTAGA AAAAATAATA CTTACTCTTT TTTCGTTATT AATAATCTTT 7560 

TTATTTTCTT TTTCATAATT ACTTCTATAT TGTTTTTTTA AATTTTTATT TAAAAACGTT 7 620 

TTTTTAAATC TTTTTTCCCA AATTTCATAA AAGTCATTTG TTCTGTCAGT TTTTCCATTC 7680 

ATCATCCATA TTTTTTTACT ATACTTATTT TTAAACTCTT TTATAAAATG ATTTGAAATG 7740 

TCTTCAATTT TATATTCTTC CTTATATTTT TCTATTGCCA ACTTTAAGTT TCTTAATGCA 7800 

TTTATATAGG TTTTTTCATT GTTGCTTATT TTAAGTATTT TTGTTATTTG CATTTTTTCT 7 860 

ATTTTGTGAA CTTCTACTAA CTTGTTTGCA ATATATTCTT TGTAAGAAAT TTTATTTATT 7920 

TTTCCATTAT TTTTTTCTAT AGAATTCTCT ATCTTATTTA TACCTTTTAT ACCTTTAGGT 7980 

ATAACATCCG CAATTGATTC ATCTGCAATT GAGCTTTTAG GTTTTATATT TCTTATATTA 8040 

TTCTTGTTTA TAGTATTGTT GATTTCCTTG AAAAAATCAG ATACTATTTT TTTATCTTTT 8100 

AAATATTCTT TTATTTCTTT ATTAATTGCT TCCTGAATAA TTATAAAGCG GTGTTTCCAA 8160 

AGATTTTTGT TTTGTATATA AAATGCAAAG CTTCCGTTAT CTTTGCCTAA ATGTTTTAGT 8220 

TTGGTTTTTA TTAAGAGTAT TTGATTTAAA AATGATATAT CATATTCTAA GGTCCTGATT 8280 

GATATTTTTT TATTATCTTT TGCAAGGCAT TTATTAACTA TATTATGTAT TTCTATTGTG 8340 

GAATATGTTT TAAGTTTGTT AGATTTATAG TATTGTTTGT TTTTAAGGTC AATTGCCCAG 8400 
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CATACTTTGA GTATTCGTTG GTATATGGCT CTTTTTTTAG TTAAATATGA TTTTAGCCTT 8460 

GAGCGTTTTA ATTCTATTAA ATTAGAGCTT GCGTTTTTTT GATTGTACTT TATAATTTCT 8520 

TCTAATGTTA TGAGATTATT AAAATTTGTA TTGACATTAT TTTTTATTTT TATTATCATT 8580 

ATCTTATCCT GGCTTCTGAA GTTAAATTTG TTGTGGTTTC AGAAGCTTTT . TCAATTATTT 8640 

GGCTTGCATT CTAAATTCTT ACTGCATCAC AAACGAAATA ATTAGCTTTT TACTATATTC 8700 

TATAGCAATG TTTTTAAAAT GTCAATATGA TAGATTATAA AATATGACCC ATCTTTTTTG 8760 

AAGCAATTTG TATTTCGTGT TTTGTAGATT TTCGGCTCAT TATTTTTTTT GCTTGTTCAA 8820 

TTCTTAATTG AATTGTTTCT TTCATGCTAT TTGTAATAGG TTTGGGTCTT CTAAAGTCCA - 8880 

TTAGAAAATA TGTGCAAAAA TCTTCTAAAA GGTAAGGACG GTTGTCTACA TGGATTGCGC 8940 

ATTTTAAAAT TTTTGATTTT TTAGATATAG TATTTTTGCT AATTGAAAGA TTATAAGAAT 9000 

CTTCTAATAT ATTTTGGAAT TCTTTTAAAG AATAAAGTCT TACACCGTTA ATACTTAACA 9060 

TAAATACCTC. ATAATTTCAT TTTATTATAT ATTGCATGTT AGTTTCAAGG ATGTTAGGTT 9120 

ATATGTTGAA TACTTTTGTT AGGGTGTTTG TCAAGAGCTT ATTAGATTAT GTAGCTTGGG 9180 

CAGATTGCAG TAATTTGTCT TTCCAAAAAA AAATTACAAT AATGTGATAT TTTTAAGAAA 9240 

TGGGGTTACA TTTGAAGCTT GGTTTAAGTA TTTTTTTTCA ATTTTATCTT CTAATAAGGT 93 00 

GATATCGATT CTGATACAGC TATTTTCTTG TATAATATTG ATGTCATTTA ATATAAAGTC 9360 

TAAGTCATTT AAGTTTAAAT TTTTAATCAA AAAATTTGTT CTTTCTAAGA AGATTAACTT 9420 

TATTTTACCT CCCAACCCAT TCTCATTCTC AATAAAAGAT CTTAATGTTT TTAGAATTTT 9480 

TTGTTTATTG TTGATAGTTT TTATTTGATT TGAATTTGTT AAAACTAGTT CTTCGTAGAT 9540 
TTTTGTGCTT. AGATTTAGCA ACATTCTATT C6TTGTTTTA , QTGTTCGTAT- TTAAATTTTC. . 9600 

ATTAGTTTTT ATATCTGCGG TATTAAGAGT TTTAATATTT GAATAGCTGA TTTTTGTTAA 9660 

AAACGGAAGT TCAATAGTCT TATCGATGCC TTTTAATAGT AAATTAACTT TTTGGTTGTT 9720 

TGCTTTGTTT TCAAAAAGGT AAGTATTGTT ATTTTTTATA ATAGGAATAA ACGCATTTTC 9780 

TATATTTTCT TTTCTATAAA TAGATCCAAG TATTTTAAGT TCGATTAAGT AAATTTCATC 9840 

TTTATTGATA GCTTTTAAGT CAATTGTGTA AACTTTGACT ACCATCATGT CATAAACTAT 9900 

TTTTAGTTTT TCTTCACTTA CATAGTTAAT ATAAAATTCA AGTTTTCCCT TTAGAATGTC 9960 

TTGTGGTAAT TTAGAAAGTT CATTTGACCT TAATTGTAGA CTAATAATTC CGCCTTTAAA 10020 

TGTTTTAAGT GCTATATTCT CTTTTGAATT TGTTTGAATA ATTTTTTCAA AATTAA6TTC lOO&O 

AAATTTAAAA GCTATTGGGT TGATAATGAA GATTTTTTTG TTTTTTACAA AGTAAGTATT 10140 
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AATAATTGAC CTTGGGTCAG TATACACGAT TTCTCCTATA GATGCACTTT GAAATTTATA 10200 

TAAATTGGGA TTAGATATAA TCTAATCTTT AAATTGGTTT TTGTTAGAAC AACACCTAAT 10260 

AATAATAGTT TTTTAATTTT AATTCAAGCT CTAAAATTAG AATGTTTTTA TTTGAATTAA 10320 

TTATATTATT TAATTTTCTA ATTTTTGAGA AATTTTTTTA AAATAAATAT AAGATAAACT 10380 

AAGGGGGGTT TTAATGAATT CAAAATTTAT TTTAAAGTAT TTTATTTTGG CGTTTTTTTT 10440 

AGTTTCTTGT CAAACTTATC AAATAGCTTA TGATAGGTTT TCTCAAGTAT TAGATTCACA 10500 

ATATGATATT GGGGTAAATT ATTCTAGAGA TGGAATATTT AAGTCTGTAA TTTCTATTAA 10560 

ATATGATAAA TTGAAAAATA AAAGGGAATA TTTTATTTTA GTTAGAGTTG AATCTAGAAA 10620 

TTCTAGTCAA ATAAAGCCCG AAAAGATAAT AACAGATACT AGATTTGAGG CTAAAGGAGA 10680 

GTTGGTTTCA GAGGATAGCA AACGTGTTGT TTATTATAAC GATTTTTATG ATTCATATTT 10740 

TCCTTATGAT TACACAACAG TGATTACTGA AAAAAATATT AAGGTAGAAA TTTATAAATT 10800 

TATTATTTCA GAAAGCGAAT TTATAAGATT TGTTGCCtTG GGAAATGATA ATATAGCAGC 10860 

ATTTAGAATC TATGCGTTCA GAAATGATGT TATTGTAAGT TTTAATAAGA TTCCTTTTAA 10920 

AAAGTTTTTG GATGATTTTA ATTCAAAAGT TAAATTACTT GGTGGCAGTT GACTTAAATT 10980 

TAAATAATTT TTAAGCCCAA GTTAAGTAAT TATTTGTTAA AAAGGATATA GATTAAGGGT 11040 

GTTTAGTATA AACAAGGTTT TTGATATTAG TTTATTATAA TATCGACTTT AAAATGTTTT 11100 

TAATATCTAA TCTTTTGAAA AATTAATAAA TTCTAGTATC GCTTTTTCAT TTCTCAGCAA 11160 

GAATAGCCCT TCCCTTATTC CATTATGGAA TTCTTCAAAG GAAATTAAGA TTGTTTTTAA 11220 

ATTTTTATCT TTATCATCTA TATTGTCGTA ATAAAATATA AAGTAAGGTC TTCCAGTATT 11280 

ATCTTTAAAG CCAAGAAAAT TTACAAATAT TGCTGTTTCT TGAAAATCTG TTTTTAAATT 11340 

GTATGAGTGA CCATTTTTGT ATAAAAAAAT TCCATTTCCT TC7VAGATTTT TAATTTCTAA 11400 

ATTATTGATT GTATTTTTAA TTTTAGCAAA ACTCTCAATT GCTTGTAAAA TATATTTTAT 11460 

TGATGAAAAT TTGGTATAGT ATATGCGGTT ATTGATTTGA AATTCTAAAA AGATTCCGCA 11520 

TTCATTACCG GCTCTAATTA CATCTTGCTC ATTTTTAATA GAAGTTGCAA TTTTTTTGTC 11580 

AATAACAAGA TTGATTTTGA ATGTAGAAAT ATGGTTTAAG GTTTTTACAT TGTTAATTGC 11640 

TAAATTTTCT GCTAGATAGA CTTTATAATT AATAAATATC CCTTTTAGAT TTTTAATTTT 11700 

AGCTTGTTTA AATTCATAGT TTATATTTTG AGCATATATT GCCAAATTTT TAATCAAAAA 11760 

TATTAAGAAT ATAAAAGTTT TATTTTTCAT TATACAACTT ATTATATGAT AGCAGTCTTG 11820 

AATAATTTTA GTAAACCTTT TTTATAGATT AAGTCTGAAA TTTATAAAAA TTTTAGTTAT 11880 

AAAAGTAGTT TTTGTTGATT TTTTAGAGAA TATGTCTTTC AATATTTTGC AGAGATTTGT 11940 
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GTTAGATGAT AATCTACTAT TTATAAATCA AGGATTATAA AAACAGCTTT TTCCTTTATT 12000 

CTGGATAGCT ATACAATAAT TGTCTTACAA TTTCATGCAA TTCTAAATCA TTAATACTCT 12060 

TTCTAAACAT TCCTTTTTGT ATAGCTTTAA TTTATAGTTT TCTATTGCTA TGTTTTTATA 12120 

ATTAGCCATA AATATAGGCA TAAATGTGTA AATTCTAAGC TTTCATCTTT TTTTATCCAA 12180 

ATAATACTTT ATTTTCTGTT CTGTGTAGAA AAGAACCCTT AATAAATCCA ATTATGACAA 12240 

TGATTACATT CATTTATTAT TAGAATTTGC CTCCAATATT TAACTTTCTA AATTCATCAA 12300 

TAACCCAAAG ATAGTAATCT TAAAGATTTA TAAGAAAAAA TATTTTATTT ATTTATATGA 12360 

GCATTACTTA AGCCATTATT CTAGCTTTGA ATAATATTTG ATCTTCTCTG CAAAAATCTA 12420 

ATTTAAAAAA AAATTTTAAA AATACATGGT AATACTCAAT TATTGAACTA ATAATTGAGT 12480 

ATTTkAATATT CTCCTTTTTT AAAATTAAAA GAATTTATTA TCAATATTTA CTTCATACCA 12540 

TACATTCTTT TAAATAAACC TCTTATCTTT AAGGGGTTTT CTTTTTATTA AATCTTTAAG 12600 

ATTACTATCT TTGGGTTATT GATGAATTTA GAAAGTTAAA TATTGGAGGC AAATTCTAAT 12660 

AATAAATGAA TGTAATCATT GTCATAATTG GATTTATTAA GGGTTCTTTT ACATAAA6AA 12720 

TTTGCTATGC AATTTTAATT TTTGTTTGTA ATCGCCAATT ATTAAAAATA AAATTATTAA 12780 

AGGGAATTAA TGTAAAATTA ATTACCTTTA AATATACTTC TTTTAGAGAA TATATCATTA 12840 

CTAATATTAA TCTATTACTA ATGATATTAT TAAATTAAAG ATCTATAGAA ACATCAGTTT 12900 

ACTTATTATT AGAATTAAAG TTTATGTAAA TTATAGGTTA AAAATTTTTT GTAATCTTTA. 12960 

GTAAGAATGT TAAACCTATC TTTTATTAAA GACAGGCTTT GTATTATAAC AATTTCAATA 13020 

TGCAATTTAA AGGCTACTAT ATATTGAATA TATGTCATTT TTTAGTTTTT CTGCTTCTTT 13080 

TCTTTT.TTCT GAGACTTGAT TGCAAATATC TTCTGTATGA GATTTAAGTG CATTTTCATC 13140 

TGTTTGTATG TTATTTATAT TATTTTGATA GTCTAATAAG AGTTGCTGCA TCATTTCTGA 13200 

GACTGTTGTT TTTGTAGATA AAAATTTTCC CAAATAATAT TTAAGCAATA CAAGATTTAG 13260 

TAAAGCGTAT ATTTTTATTT TTTGATTTAA TTTCAGTTAT TTTTAGGATT TTTATTATTT 13320 

TAATCATATT TTCTTTATCA ATATTTAATG TTAATAAAAT T6AAATAATT TCTTTACATA 13380 

AAAAGTCACA TTTATTGAAA TGCTTTATTA CTTGATACTT TTCTATTTCG TTAATTTTTC 13440 

TTTCTTCTTT TATATTATTA TTACAATTCT CCAATTGTAC ACTACCCATT TTTGTATCAG 13500 

AATTTTTATT AAAATAGTTG GCAACTCTAT TTTGAAATCT TTTTTCTTTT TTTTCTTTAA 13560 

AGTGTTGGTT TATCTTATGG' TAACAATCTT TTTTAGGATA ATTAAGCTTr TAATAAATTT 1362-0 

CyGTACCCGA ATTTACCCCC ATATGTTGAT AGTAGTTTGT TGTGACTTTT ATTTCTTTTT 13680 
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GTAGTCTATA GATATACTTT ^GCATAGTTC TTAGTGTAGA 
TTAGATTTTC ATTAAAGTAA TAGAGTATGG TTTTTTGTGT 
TTAGATAGCA TATTGTTGAA ATAAGAACTA TTAATTTGTG 
TTCTATTGGT TTTATTTGTT GTTTTTGAAT TCATAGAGAC 
ATCATTTTAC AATATAACTA AAATTGCTAT AAAAGTAAAT 
TATATTGTAA AGTTTTAGTA ATTGAGATTA AAATTTATTT 
TTTAATTTTT GTTATACTAT AAATAGTTCG ACGAGAGTTC 
TGAAATAGGG CTTAAAGCAA GTTTTTTATA AAGAATTTGT 
TGTAACACTA ATTTTCCCAG TTTAAGTTTT ATTTTGTTTT 
TTTTAGATTA AAAATTTTCT AGAATTTAAA GATATATTGG 
TATATTGGTA ATTAAGTAAT TATTTATGTT CAAAATCCAT 
TGGATTGATC ATTTATAGAT CAAAATATTC TTTATTGGGC 
CTAGGATAGA TATTGGTTTA CTATTTATAT AATCGATTAT 
TTAGCTTAAA TATTAGGATG AAGATTATAA ATTTTAGTGC 
AGGAGTGTAT AACGGCCTAT AAAGCTTTCA TTTTCTTTAT 
ACTTTTGGAT TTTTTTCTAA TATTTCAAGA TATTCTAATA 
GTTGAGTCGT TTtAGCTAGA GCAAGATTAA ACTTGCTTTT 
CTTTGTTTTC ACTATAGAAC AATTCTTGAT TCATGTGATC 
(2) INFORMATION FOR SEQ ID NO: 10: 

( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 107 4 9 . base pa.ir.s.. ^. . . 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



;a^:g 
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AATAGTTTGA ^CGTTTTTTC 13740 

ATATTTCTTA TGTGTTTTGT 13800 

TTGAACTTTA TTATAGCAAT 13860 

TTCTCCTTAC AATTATGGTG 13920 

ACTCTTATAG CAATTTTAGT 13980 

AAAATACAAC TTGACTATGG 14040. 

GAATTACAAA GAAGTGATCG 14100 

CTTAAGCCCT ATTCATTTTA 14160 
GGGCACTATA ATAATGATTT . 14220 

ATTTATTTTG TATTTAGCTT 14280 

AAAAGACATA TAGTCCTTTA 14340 

CTATTATAGG CCATAATATA 14400 

AGTAAATTTT CTGGATTATA 14460 

AACAAACTTC TAAAGGGTAA 14520 

TTGTGGGACA TTTTACGATT 14580 

GGGTTTtATA ATTAAcTCGT 14640 

TATTAATAAA TGAGTATAAT 14700 

TAGTGTTTTG AC 14752 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10: 

CTTTTTTACT TTTAAATTTA GTAAATTGTA AATTTGATAG TCTTAATTTA TCTACAAAAA 60 

GCGTAGATGA CAAAAACAAT TCTATAGCCA AGCTTCTTCA ACACTTATCA AAAAGTGAAG 120 

ACCAAGCCAA TAAAACTTCT ACCTCAGAAG ACCAAAAGGA ATTAGAAATT ACGGAAAACA 180 

AAGAACAGGA ACATGAAAAA CTTTCACAAG TAGCACAACA TGCTCCAAAC TCAAAAATTG .240 

AAAAAGTAAA ATCCGATGGA AAACCTGTTC CTGGGGACAA AATTCTTTCT TCAAATAAAG 300 

ATATTTACAA TTCTTATATC CCAGAAGTAA AAGAGGAAAT TGTTTATGAA ATTCTTGAAG 360 
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AAGTGATAAT TCCCGAAACA AAAATTCCTG AAATTACTGA AGAAGTGATA ATGCCTATTC 420 

CACAAACAAT AGATTTTTAT ATT6AACCAA GGCCAATAAG TAGTTTCCTT ACTCAAGGGA 480 

CATCACCAAG TATTAGAAGT ACAATAAAAT CATATAAAGA ACTCGCTAAA GAAAAAATTA 540 

ATAATGGCTT GAATATAGTA CAGAAAATAA CTCAAAATAT TGATAATATT ACAGAAAATT 600 

TAAATTCTAA AGAAACACCA AAGGAAATAT CGGGGAAAGA AGTTGAAGAA AAAATTACAC 660 

ACCCCATATT TGATCACATT ACTGGAAGCG GTAATAATCC CGGACAAGAT TCTATATCCA 720 

ATACATGGGG CGAAGGACTT GAAATTGGTG GTGATAGCAA TTTCTTTACC AATTTAGAAG 780 

AAGTAAGAAG CTCTATAAGA ACAAAAATCA AAGTTTCTGA TGGCACTGAG CAAACCAAAG 840 
ACAAGGTGGA AATAGATGAA ATTATAGAAG ATTTGCAAAA ACTAAAAGAA TTTCTAGAAA - 900 

AACTCAAGAA ATATCTTAAA GATACAAATA ATCTTAGCGC AATCGAAGAA AGTGTAAAGG 960 

GTTTAAGTTA AAAGAACAAT CGGATTTTTA ACTTAAAGTC GAAATTACAT ATACCTATAT 1020 

TAATGACTTA AAAACCTAAT TACAAAAACT TTAGTAATTG GGTTTAAATT AAAACACATT 1080 

ATTTAGTAGA GGCTACATCA TTTTCTACAT CTAAAATTGA TTCGTAAAAC TTATAAACAA 1140 

GTTTTTATAT CTTTTAAAAC ACAAATCTCA ATAAAATATT TTTGATTTTA GAATTACTAC 1200 

TAAACAACTA AAAATTATTC ATTCTTTGAT TACTAGGGCA AAAGAAACAC TACATGAAAT 1260 

CAGATATAAC TCTCATTCAA AAAACTTCTT TTTAGCTAAA ACACCTTGTA TTTTAAATCT 1320 

GTACCAAAAG CTCAAATATA TCAAGTCATT CGCACCTTTA AAGCTCAATC AAAATAATCT 1380 

AAATTATTAT CGAAATAGCT CCAATGAGCT TACATCTACT ATTACAAATT TAATTTCAAA 1440 

TTTTTTTAAT GAAAATGAGT CTTGCAAAAA TTTGTATAAT CTAACGTTAT ACATTAATGC 1500 
CAACCTAAAA .AAACT,C3GGAA T^CTAT^i'W^AA. TACTTGTAA.A^ AAATTATATC . . - 1560 

TAAAATTTTT ATTCTTGATT AAGGTAAAAA TTCTTTGTAA TTTCTACTTG AAATAGTTGC 1620 

CAATTAATGT CATAATTAAG GACGACAAAA TAGATAAAAC AATGGGCGAA ACTACTGATG 1680 

CAATAACAAC TGACACTCTG TTTTTCACGC TAAGCTTTTC CAAAAGAACT TTGTTATTGG 1740 

ATTCCAGCTT TTCCAAAAGA ACTTTGTTAT TGGATTCCAG TTTTTCCAAA AGAACTTTGT 1800 

TATTGGCTTC CAGCTTTGCT TCTAGCCTTT GTTCCAAATT AAACATATCT TTTTGTAAAT 1860 

TCTTTTCTAA GTTATCAATC TTAGTAGTAA GTTCGCTTTT AACAGTATCA ATCTTAGTAG 1920 

TAAGTTCACT TTT/^CAGTA TCAATCTTAG TATCTAAATT ATCTATTTTT AGATTTAAAT 1980 

TCTTTTCTAC GTTATCAATC TTAGTAACAA GATTGTCAAA CTTTATACCA AATTGdTTTT 2040 

CTAAATTTTC TAAATCTCTA TATGTTAGTT CATTGTAATA ATATCTTTTT GACAAATCTT 2100 
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GAGCTATTAG TTGTTCCATA^^CAATCGTA GAAACTCTCT ATATATTTGT^rcTTCAGTAA 2160 

ATTATGAAAA AAAATCAAAA AAACAAGTGC TCAGAAATAG AAAAAACACA ATTAGAAATA 2220 

ATAAATACCC AATCAGAAAT AGAAAAACAA CTCCATCAAT TAGAAATTGA GTTTACTGGG 2280 

GTATGCCTGC TTTATGTGGC AATACATTAT TAAATCTAGA ATTGAATAAT TATTCTCAAA 2340 

AAAAACTATT AAAATTTTAC AACGAAATTC TTAAAAAAGA TAATAAAAAT TCTTGCGATC 2400 

TACCAACAAT GAGTATW^TAT CTTGATATAT TAGAAAACAC AAAAACCATA ATAAAGCTAT 2460 

CTTTTAAAAA TCATCCCAAA TATATAATTT ATTATAAAAT TAATTACCCC CTTAAAGTGT 2520 

TTTGTTCAAC AATACAAGAC TACTATCAAA CAATAGCAAA CAAACTAAAA CTACGGCTAT 2580 

AACTAAACTA TCCTACTACT ATTTAATCGT AAAAAAATAT TTCTTTGCAA ATTAATCAAT 2 640 

TTAGAAATAT AAATGTAAAG ACATATCTTT TTATTTGATA AATAATAAAA ATTACTGGGG 2700 

CACTATTTGG AAAAATTTTT AAAAGAAATA TTAAGTATGA ATAGCAAAAA TAGGCTATCT 2760 

TCACACTTAA TAATTCTTAT TTACACGCTA AACAACATTG ACCTAAATTC AAAAAATATT 2820 

GGGTACAAAG AGTTTGAAGA GTTAAATAAA GCACATGAAG CTGCTTTAAG TAGTAGAGAA 2880 

TCTTAGCTAG TGTAGCTTCA AAGAAGACAT GACACTTACT TATAAATAAG GAAGCTTTTG 2940 

GATTTTAACA AAAATAGTCT GGCTTTTTTG CACATATAAA ACAACTCCAT TATTTCTAAG 3000 

ATAAATATTT TAAGCTCCCT GGTAAAGTAA TTCATTTATC CTAGATTTAC TCTTCCACTT 3060 

CTATACGTCC CGTCCTGCTT AATCATTAAT TTTTAAAATT AAATGTTTCT TTCTAGTTAC 3120 

GCACTATATT GTTACTATAA CAAAAATTGA ATCTTAAAAA TTAACATATT ACTTTAAAAA 3180 

AGTATACTTA TA6GAGATGC TTATAAAGCT TAACAAACTT ATTTTTACCA ATATATATAT 3240 

CTAATATCTC TTATACTTAG TTGCTCAATA TCTAAAGATT TAAGTGATAA GCTCTCTTCA 3300 

CTAAAATCTA ATGATTTTTT TAATTCAGAC ACTTTAGTTT mTGATTCTAG CAATTATGCT 3360 

CCTTTATTAG AAAATTCAAC TACTGGCAAT ACTGCCTTTA GTAGCAAAGA TGTTGCTACT 3420 

GCACTACCAC AAGAGATTGC AATAGAAAAT CTTTTAAAAG AAAAATTGTA TGAAATTAAT 3480 

CAGATTTCTT CAGAAGATAT TCCAAATATT GATGATAAAA TTACTTCTTT GGAAGCTTTA 3540 

AAAAAGCAAT TAGAAGACAA ATTAGAAATC AAATTATCTA ATCAAACACA CATAAAACAA 3 600 

GACGATAGCT TTAATAAGCA AGCTCAATTA CAACAATTGA ACCCAGGTGT TTCACAAAAA 3660 

CAAGAAATAG ATAAAAAAAC ATAGAAAAAA GAAGCCTAGA CAATTCTTCA CAAGAAAAAG 3720 

AACTCACAAA CCCTGCTTAT TCAACACAAG AACATACAAA AAGTGCTACA AACTTAGACT 3780 

CAAAAAAAGA TGCTCTTATT AAAGAAACTC TTGAAGCTAT AAAGGAAAAA ATTAAAGAAG 3 840 

AAAAGAAAAG CTATTCTAGA AGAGCAGCAA AGACAGAAAC AACAAGAGCT TGATAAGATT 3900 
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AAAGCACAAT ATGAGGAAGA GAGGAGAAAT AGAAAAGAAA GCAAGACTTC AAAAATTCAT 3960 

GCAAACTACT TCTGACTTAA CTAATCTTGT TAAGATGGCT GGGCTTGAGG CTTATAGCAT 4020 

TTCCCATAAA TTAAAAGATC TTGAAAAAGG TATTGAAAAT TATGAAGACA ACAATAATTC 4080 

TACTAAAGAC ACACTAAACC AATCTCTTAA AGATGTTATT TATGAGATTA CAAAGCTTAG 4140 

TAGTCTTATA GAAGCAAAAG ATAAGATTGA TCAGCGTAAG AAATTGGGTT ATCAGACAGA 4200 

ACAAGAGTTT GATCCTAAAT TTATAAACTT AAAGAACATC AAAGATAAGC TAAAGACTTT '4260 

ATGTGGTAAG GCTAAAGGCC ATCTTGGTAG CAATCTTTCT AGCGTTACTA TTGATGGGAT 4320 

TACTAAAGAG AAGGTAGCTC AAGCTTATCT TATCATTAAA CTAATACACA AAACATTAAT 4380 

TTATATGAAT GATGATAGTA AAGGTAGCCT TGCTACTATA CTTAATGACT TAGAAAAGGA 4440 

TGCCAAATCA ATATAACTAG CACAACAATA TCTTCTTATT TTAAAAAAGC CTAAGTACTT 4500 

GTATCTTAGG CTTTTTTAAA AATTATCTTG CCTCTTAGAC CATTCTTGAT CATAATAATA 4560 

CTGTTAAGAA TAAATTAATG CTAAAATGGA TAAGTACACT TACACTAATT ACTATTTTTG 4620 

CAGTAAATAT AAAAACATTC CCACTACTGA TGGAATAAAT ATTCCTAATA TCCAATAAAA 4680 

TGGATATATC AAGCTTTTTA TATGCGAGTT GTTCTCACTT CTTATTTCCT TAAACAACCC 4740 

TATAAGCTCT TTATGATTTG TATTTATTTT TTCATCTAAC TTGCCTATTC TTTCATCTAA 4800 

CTTTACTATC TCACCCTTAA GCTCACTTCT TACTTTTTCT ATTCTTTCAT CTAACTTTAC 4860 

TATCTCACCC TTAAGCTCAC TTCTTACTGT CTTTATCTCT GCAGAAAGCT CACTTCTTAC 4920 

TTTTTCTACC TTTTCATCTA ACTTGCCTAT TCTTTCATCT AACTTCCCTA TTCCACTTCT 4980 

AAACTCATCT CTAGCTTTAT TCATTTCCTT TTCTAGCATA CTCATGCTAC TTTCTAGGTT 5040 

TTCATATACA «TAATTTGAAC-.JTACGAAGTAG CACATAATCA ACTACATCTT. CTGGAAAATC . . ....5J.00 

CTTATCAAGA AATACCTGCT TTACATACTC ATATTTGGGT TTAGCTTCAC ATGCAAAATT 5160 

ACTCATATAA CCCTCCTTTA CTGCAATTTA ACTACTTTTG TTATCTATAT TTAACATCCT 5220 

TAATATCTAC TATTAATAGT AACACACATT TTAGCTAATA AGATAGGTTG TCAAAGCTAG 5280 

TGACAAAATC AAAGTTCTTT CTAAGTCATC TTTTAGTATT AGTATTGCTT GTCTTAACAA 5340 

GATTCATTAT CATTACTTCA CTTGTCTGCT TCTAACTACA AGATCAATAT TTATTGATAA 5400 

ATTTCTATAT TTCCTAATTA CAAAATTATA CTTTACTAGT TCTCTGATAG CTCATAGCAA 5460 

ACTAGACATA AGAACCCCTA AAACTAGATT ATAQGATAAT CTAGACTAAG CTTCTGGCTT 5520 

CTATTTTTAT AGAATAGAGA AGCTTGGCTT TAAAAAATAA CAATAAAGAA TAGCAGTTAA 5S80 

GAACTGCTAC TATTCATTCT ACAGGTCATA AATAAGTCGC TTGCATGCTT CTGTTATATC 5640 
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f ACACACAACT TCTCTTATTA fiECTTAATGG CTTACTAAAC CGTTTTTCTT ^ctIcTCTTACC 5700 

TTCTTGCATC AACTCTTGAG CAACACCATC. GCCATTTCCT TTAATATCGC CAAAAAGGCT 5760 

TTCTACTTTT CCCATTAACC CAGTTACACA CTCCTTAACA ACTTCACCGT TTTTCTTAGC 5820 

GCCTTCTACT TTAAGAGAAA ATGCTACAAG ACCACCTTCT TTTCCTCTTC TAAATTCTTC 5880 

TATTACCTTA TTTACCTTAT CACGCAAACC ATAATCATCA TCTTCATGCT TAAGGCCACT 5940 

TTCTTTTGCC ATTTCTAATA TTTTTATAGT AAGCATATGC TACTTATCCC TGTCTTAAGA 6000 
TTATCTTTAA GTGCTCCTGC TACATTTATC CTGAAGATAT TAATGCAGAT ACACCTGCCT . 6060 

CTATCCTTCT AGCTGTTTCT TTAATTTGGC TTACAAGAGA AGGTACTTCA CTTATTGGTA 6120 

TTTTGCTACT ACCGCCTTTT GTCATGCTAT CTAGTACCTT AACCTTAGTA TCACTAGCTA 6180 

CATCCTTTAC CTCTTGTGCC ATCTTTTCAA GCCCATCTTT GCCTAATGCC TTACTCTCTT 6240 

ATTTAGACTA CTTACCTACA CCCTTTTCTT TAACAACAGC AAGATCAAAA GCAGGTTCGG 6300 

CCTTACTAGT CTTTTATGCT TCTGCTGGCC CAGTTCCTAC ATTTGAATAA AATAACTTAC 6360 
AAGAGGTCGC TAAAAGAACA CTACATAAAC ACAAATATAT CCTCATATTA AAACTCCTCT ' 6420 

CCTTAAAATT AAAAACTTAC TTGGTTACTT AAGTAAGTCT AGTCCTTATT CTCTTTTTTA 6480 

ACCAAGCCCA CTTACTTATT TACTTTTCTC TTAGCCTTAT AGCTTGTATC AAATAATACA 6540 

AGCTATTTTT ACAAATGTGA TATATTCTTT AATGATAAGG TGTTAAGGGG CAAGAATACA 6600 

GATAGAGCAA GATGCAGGCA GTATGCAAAG ATATGATTAA AGACATGCAA ACTAACATAC 66 60 

AAAATAATAA TAGTAGCCCT ACTCCTCAGC AAGTTAATAA CCAAGGGAGC GAAGCTAGAG 6720 

ATATTAAGAG GGAAGTCGAC TCTTATGTAG AAGAGTTTAT TAGACTAGAT ACAGAACTAG 6780 

ATGAAATAAA AGTAAGCCTT AGTAATATGG AATGCTTGCT TAGCACAGCT GCCTCTTATT 6840 

TAAAAGAAGC TAGAACTACT CCTAGATCTA ATAAAGTTAA GTATTCCTTA TTGTATAACT 6900 

TGCATAAAGC CATTAGCAAG GTTAAGAGTA GTTATGCTTC TCTTAATGTT TGCTATGTTG 6960 

ATGCAACTTA TTCTTTAGAA AAAGCTTGTG TTATTTTTAG AGATACAAAT AACAAGGCTG 7020 

ATGATGCTTT AGCAGAAGCT TTAAAAGAAA GCAAGGATAT TAGATACAAC ATGTTTTCAG 7080 

CATTATTGCT TGACAAATCA CAACCTAATA CTAACAAGAA GGCTAATATT GTAGATAATA 7140 

ATGAAATAGA AAATTTTTTG TTTATAAATC TCTTCTCCTT AGATTTTAAT AATTAAAAGT 7200 

CACTTTACAA AAACTAAAAA GCAATATAAA TAAATATACC TCGCGGGATA GATAGTAGGC 7260 

TCTATTGCAA CAAGCATGAC TAATTTTATC TTTTTATGTA ATAAAACTAG TCCAAATTTA 7320 

TATTTATTTT TTGCTTTAGC TATAGAAATT ATATTCTAAA TTAATCATTT TTTAAATATT 7380 
TATTGGTTTT TATTTGTTAA GCCAmACTAG CTTTATTrAT GGGTAAATAT TAGAAGTATA . 7440 
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yCAAGATAAT ATAATTTATT ACTTAAATGA AAATCTTAAA 
GCATCTTCTT TTTTTTTAAC TTTTTTAGAA AGTCTAAAAA 
ACACATATTA TGCTCGCAAT TTTCAAATAG TGTAATTAAG 
CAAATACyTT TCTCTAAAGT ATAGTCAAAT AATAGCAACA 
TTAATGTGAA TCTCTAAATC TCTGGCATAC ATTTTAAATG 
ACAGGATTGC TATTAATAGG AGAAAGTCTA ATGCACTCAA 
CTTAAAGAGA TGGGGGATTT GAAAACATAA AATAATTATC 
CTTTATCTCT ATGATGCTCC TTCACATCTA TATGATTTCT 
GCTGATTATC TCTACCATAT TTAATATAGC TAAGCGGCTT 
TCAGTTTGAA TAAAAACCTT TTAACATACT CTTCTATTTG 
AAAAATTAAA ATGCGCTGAT TTTATACATT TACGAAAAAA 
ATTACTAAAT CTAAGATTGC TTTTCTAACC TAGTTTTAAA 
ACAAGCTTTA GTCGCTCCkC ATATAAAATC CAAAATTCAA 
TCAAGTAAAT TTAAATTGGA TAGTAAAATA TTAAATAGGG 
GAGTGATAAA TAAATTTTTC TCTTATTAAA TAGTATAGTA 
GGGCCATTAT TCTTCATTAG ATACCCTGCA CAATTTTAAA 
GTTGTAACAG GCACAATATT TTTAACAATA TTAAGTAATC 
TCTTTTGATG AATTCTTATT CACTTTTTTT GTTTCATTTG 
TGATAAAATG AAATTAAGAT TGGAATmAAG CTGACAATAC 
^^..TAGTAAAAGC TATTCT/^T ACTTACTTTA AAACATGQCA. 
ATCAAAACAA TATTTTTGAC TTTTATCTAA ATCAGTTAAT 
AAATCCATTT TCTTATCCAC AATACTTTTT TACAACTAGA 
AACAAGCTAC ATATTTACAT ATTATGTAGC CTGTTTTAAA 
ACCAAACC3CC ATTCTTGTCA ATGATACCTT GCACTTCTTT 
AGATTGACGT TACTATTGCT TTATATGCTT CGTATAAATT 
CAATTAAAGT TTTTATTTCT GCTTCAATGT TCTCTAATTT 
TTATGTATAC AAAATTTGCT GCAGTCTTTA CACTTACTTG 
TGAAATTTTT TTCAAGGTCT TCTTTTGTAA ACTTTGCAGC 
TAGCAAAGTT GTCAAGGCGT GTAGAATACA TTTGGGTTAG 
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AGAACTATAC AAATTACTCA 7500 

ACTTGTGCTA AAATAAAAAA 7560 

CTCTTGTATT TAATAATAAT 7 620 

CTAAAAAGTA GTAATATTCA 7680 

TCATTCAACG TCTTATCTTC 7740 

TTCTCCATTA TTGCTATCCA 7800 

AAAAACATTA GCAAATCCCC , 7860 

ATCTTTACCT TCTACATTAA 7920 

TTTAACTTTA CCCATATTTT 7980 

GGATACATCT CCTTTTCAAT 8040 

GTTAATGTAT CGAGTTTTTC 8100 

TTAATACTTT CATAAGCTTT 8160 

TTGTTTTATA TAAGTAArTA 8220 

GAAAAAACAA GCTTAATATT 8280 

ATGATATCCA AAGTATCAAG 8340 

TATAGTTCTT yAACCTTTTA 8400 

CTTTAACATA TTTGCGAATT 8460 

ATTCCAATCT TAATTTGAkT 8520 

CATTTTGTAT GCAAGCTTAA 8580 

.ATCTACCAAT TC.TGATATAA . 8640 

ATACCTTTTG TAAATTGACG 8700 

ACTTTAATTA TTTTACTTTA 8760 

TTAAAAAAAT TAATATTAGT 8820 

AAGAGAATCC CTC ATTAATA 8880 

AGATTGTTCT TTGATCTTTG 8940 

CCTTTTTGCA TGCGTGTCAT 9000 

AATATAATTT AATAAGGTCT 9060 

TTCTTCTTTA GCTTTGGCTT 912-0 

CTTTGTTGAA AATAATGTAT 9180 
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AAGTATTATA TATCTTAGT/^BtGTTTGAA TTGCTGAATC 
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CTAGATAAGA TTGATATCGA ttgcttaatc ttatttcctc 
catctaaata atactgatca taatcctctt cctctatttc 
ttgatcctgc aatgccttgt aaggaactct ttggccttaa 
caatttcatt actttcaata ggctcctcga attcaccact 
aacttccttg agtcatccct ttatattcat cttgttgttt 
tctcagattg ctcttttaat aattcagttt ttaaactttc 
tttgtaaaaa attgctttta ttagcagagt ccctttttaa 
ttctagaaac cttgcttttg cctttctttc tagcaatctt 
taggcttttt aatagattcc tcgctagtct ctaaaataga 
caggggattc ctctttcatt tcatatctta tgaataaatc 
gtaatcccaa agccaaatat ttacttttaa cttttttcat 
aatactaact ttaaatcatt ttaagtcgga ttccaaaaat 
aaagaggcaa aattattaca attttaattg taataatact 
ttatcaattc attgaatttc tctttctttt taaaaattta 
gtgaacaaag tactttttat taaattttat aaacagatct 
aaattgaaaa aagtttaaat gtagctacca tcttatcata 

TTCGAACTGT AATCAGACCT TTATATTCTT TATCAATTAT 
TTTGCTTTAA AACTTGATGT GCAGGTTTTA GTATTACTAA 
AAAAGTGCTA CCACATCTTT AAATCTTTTT TGATTTTGAA 
TTATAATTaG CA/^TATATC * CTTTCtTAAT GAACTAGAAT 
ATCAGTTTAA TTGAAAATAT TTTGGGGAAT AAGCCTcTAG 
AGAAAATTAG AAAATTAAGT AGCTACTATA AAATTTTTCC 
GATGTTCAGG AAGGATTGAT ATTGTAATTA GAAATCCACC 
GAATCAGAAT CTTCTCAAAA CATATTCCTA GCTACAGAAG 
TAAAATAAGG CAGAAATACT AGTAAGACAT TATATTGAAT 
GGCQTATAG 

{2\: INFORMATION FOR SEQ ID NO: 11: 

{ i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 10502 base pairs 

(B) TYPE: nucleic acid 



TACATTATAT^HaACACCTT 9240 

TTCATCCTCT TCATCATATT 9300 

ATCAGTGTAT GAAATAGAGT 9360 

ATCAGAATCT ATAGTAAGAT 9420 

TTCACCGCTA AGGGAATTTA 9480 

TTGTATTTTT TCTTTTCTAG 9540 

TTCCTCTAAA ATTACATTTT 9600 

ACTATGAATA TACGGTTCTT 9660 

ACCTTTACCT TTCTTATTCA 9720 

GTTTCCCTTA TCAAATAAGC 97 80 

ACAACTTATA AAACCAAAAA 9840 

GCTTTCTCTC CTTTAAAGTT 9900 

TAATAAACTT TTCTTATCAA 9960 

AAACTAATAT TTACTATTAT 10020 

AAATAAGTGC TATCAAGAGG 10080 

TAAAAAATAA CTTCTAAATA 10140 

TGCTGATTTC ATTCTTAGAA 10200 

CATTGCCCTG AATCATAAAT 10260 

GTTGAAAT AT TGC AAATTTA . 10320^ 

ATTGATAAAT ATAGTTAAGT 10380 

TTAGTGATAT TGCAGATATA 10440 
TGGGGATAAA GAAAAAATGA . 10500 

ACTATGGAAT TGAGTTTCCA 10560 

AGGGAGAAAA CTAGTTTAAT 10620 

ACTAAGCATA nAAGACCAAG 10680 

ACTGATACAA TGAGGAnA/UV 10740 

10749 



wo 98/58943 PCT/US98/12764 



908 

E^^SS : double 



(C) STRANDE 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11: 

AATGAGCAAA GTTTGATGGA ACAAGAAAAG AACTCTCTAT ATGTATATGC GCATCAATAA 60 

ATCCTGGCAG CACATATTCA TCCAATGTCG CATTAATTTT TTCTATGCTC GCAATATGAC 120 

CGTTTGCAAT CGCTATACTA GCTGGATAAA TTTCTTTATT AAAGATGTCA ATATAATTAG 180 

CTTCAATTTT AAATAAATCC ATTATTTATC CTCTCCTAAA AACTTTTTGT TCATAATATA 240 

CTCTACCTTA AAATCTTTAA ACTTAAATTA TAGCGCAAAG TGCCAGTATA TTTAATTGCA. 3 00 

ACTGTATTTA GAAAAAATAA AAATCGTCGA TATTTGTTAT ATACGATAAA AATCGAAGAT 3 60 

AATTTTTTGG GTAAAATAAA TAGAAAAAAT TTAAATAAAA AATAGCTAGC AATTCTAATT 420 

TTGATACCAG CAAAGATTAT GTGGTAAAGT ATCAAACAAT TTTTAATTGA TTTTTATAAA 480 

AAGGTTTTAC ATTAAATTTA AAATTAAATA ACAATAATAT TTCGAATCTC TTTTTCTAGA 540 

TTTATAGGAT TTTTATCCAT GCTTAAAACA ATATCTGAAA AAGCTTTATT TAAATAATCT 600 

CCCAATTTGA TATTTTCAGA CTTGATGGAC TCTTTATTGC TGTTATAATC ATTTAATAAT 660 

TGTTTAACAA GCTCTCTAAA GGTTGTTCTT AAAGATAAAA AATTTTCAAG ACAAATTTTA 72 0 

ATCCTTTTAA GATCAGGAAT ATTTAATAAC ATTAGGTTGT TTTTTTTATC AAGTAACAGC 780 

CTCATTATTG CCTCAAATCT AAATTGGAAT TCTATGCCCG CATTTTGCAT AATTTTATTA 840 

GCAATCTTCT TAATGCTATG TAAATTTGAA TTTAAAATTA ATCCTAATTC TTTCAACTCX3 900 

CTTTCATTGT AATCTAAAAC CGCATACAAA CACCCTCTAG CCTTTTTAGA TTCTTCTACA 960 

TCATCAGCAA .GTCTO TAGTGTATAC CAACTAACAT TTTTAAATGG AAGATTATAT " 1020 

TGATTAGATG GCTCACTTTT GAATTTTTCA AAAGAATTAT CTATGGCTTT ATTATTAACT 1080 

TCTACAAAAT TATTTATCCA AGATAAAAGT TCATTCTTTT CTCCCCGCAC ATATTTTTTC 1140 

CCAAGTTGTT TTTTATAATT ATGATTTTTG CTAGCCTTAT TTTTATTTAA ACCATCGTTT 1200 

TGATATGAAA TAAATAAAAA AATATTGATT AATAATATTA ATTTTTTTTC ATAAATAAAG 1260 

CCCTTAAAAT GGTTTTACAG AATATCTGCA AAGCCATAAT ACAAACTTAT AATAAATATT 1320 

AAATAGTAAT CATTATAAAA TTAAATATAA TTTAAAAATG ATTTTTTTGC AATATTTTGA 1380 

AATGTTAAAT AATTATGTGC TATTTCTAAA CACAAGATTA TAAAATAACT TCTTGCTTTA 1440 

ATATCATGAT GGCTTTTAAT TGCTTCAATT AACTTAAATT ATGCAGCTAT CTTGGCTTTT 1500 

CTTTTTTATA AAACATTGTC TTTAGCAAGG TCATAAAATT ATGATCTACT AAAATGTATT 1560 
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ATGTTAA AATAAATTTA AATACAGTAP^^TOAATATAT 1620 

TATTGCTTTT AGGAGGTCAA TCTATGTTTA GAGGAAAAGA AATATATTTC TTGTTATTTT 1680 

CGTTACTTTT GTTTATATCA TCAATTATAA TTTCTCACGG AATAAAAAAC ATTGGCACCA 1740 

AAAATGAAAA TTATATTACG GTAAAGGGTC TTAGCGAAAG AGAAATTTTA TCAACGTCTT 1800 
CTAGTTGGGG GCTTAGATAC AGCTTAACCG GTAACACTAT AAATGATATT AATAAAGCAA . • 1860 

ATAATTTAAG CTTATCGAAG ATTAAAAGTT TTTTTTTAAA ACATGGATTT AGCGAAGACC 1920 

ATATAAAAAT GGGATTTATG GAATTTAATG AAGAGACTTA CAAAGAATCT CTTTATAAGT 1980 

ATAGAGCATA TATATCTTTA ACTGTTCATA CAAAAAATAT TGAGAAAATG GAAGCAGCAG 2040 

AAAAAAATAT TGCTGA6CTT TATAATCAAG GTATATTAAT TAGTAATAGT GGGGGGCCAA 2100 

GATATTACTT TGACAATATT AATGATATAA AGCCCGAAAT GTTAGCAGAT TCAATTAGAA 2160 

ATGCGAAATT AGCGGCTTTG GAATTTGCAA AACATTCAAG TTCAAAATTG GGGAAAATTA 2220 

AAAACGCAAA TCAAGGATAT TTTG/^TTTC TTCCAATTGA TAGAAGCTTG GGCGATCAAG 2280 

AACGTTATCC AAAAAAAATA TTAAGAATCG TTACAACCGT TTCTTATTAT TTGGATTGAT 2340 

ATTTGGCGAA CTATTTTTTC TAAAAACCCA TATAAATAGC TTGCGGTTTC ATACCATGAC 2400 

GCGATCTACA CACCTAATTG AAGCATAGCT ATATATATTT ATTGCTGTAC TCTTTATCTT 2460 

GTTGGCTGCT TAGCTTAAAG TTGTCAATGT TTTTTCGTAC TCACCATCAT TTTTGTTTTT 2520 

AAGTTCGCTG CATACACCTT CAAAGTATGT TTCTACATTT TTCATAAGAG TTTGAATACA 2580 

TTTTTTAGTT TCAATTTTAC TGTTTGAATG TTCTTTAAAA GAAACGCTTA CCGAATTTTC 2640 

AGCATTAAAC TTATTTACAA CGGTTTTAAG TTCATTGTAT TTTTGGGTAC TTTTATCACC 2700 

ATTGCTACTT ACCGATATTT. TTAGCAACTC ATCCAGTAAT TTCACCATCT TTAGTCCATT 2760 

CTTCAAATOA CTTTTGGCTG CATAGGTAGC ATTATAACCT ATATTAATTA GTGTTTGAAA 2820 

AACCGAATCA ATTTTTTCTG ATGAATTCTT TATCAATTTG ATTAAGCGAG GAGTATCCTT 2880 

TACTTCTATG TTTTTACTTT CCTTGGTATT TTTTTGATCT TCAATTTCTT TTTTGGATTT 2940 

TTCAGAGTCA TCTTGAGCTT CCTTTGCTAA ATTTTCTAGC TCTTCCGGAG TTAATTTTGT 3000 

GATTTTTTCC GAACTTAGGC CTGTGGCTTC ACTTATCTCA TCTAATACTT GATCAATAGA 3060 

TGTTAGTGCT GATTTACTTT CTACAGTTGC TTCATCAATG GTATTGTCTA CATACCATTT 3120 

ACATGAAATT ATTAGCAGTA TAGATATTGC CAATATTAGT TTACTCATTT GTAAACTCCT 3180 

TTAGGCGGTG TAGTTATAGT GCAAATATTT AGCTTAGACT ATAAAAATCC TCAAAAGTGA 3240 

AAGTCAGGGA TAAGAAGATT TTTGATTTAG TTAACAATCT CCTTTCGGCG ATAAAGAATT 3300 

GAAGATTCCC TTATTGAAGA GTAAACCTAG CAGTAAATTT AAAATCATTG ATCCTAAAAG 3360 
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GATAATAGTA ATCCTAAAAA GTATACAAAA 
AAAGATAATG TTGACAACAT TAATTCGTAG 
AAAAATGGGA GAGCTTGTTA TTCCCAGCAG 
AATCCAAAAA TGATCTTGAA AATTTTTCTA 
AGTAAAGCAA AAATAAATAA AATGCTAAAT 
AAAGAAAATA ATTTTATTGT AGCCGGTCTT 
TACTTAATGA TTTTAACACA TTAAAAAATA 
CAAAGGGTTC TTGCAACTAT TTACTAAATG 
CATAAATGCC TATTAATTAA AAATATCCAA 
AAAGTATATT CCCAATATCC CAATCATAGT 
GAACTGCTTT ATAACAAAAA AAATATTTTT 
GCCAAATTCT CTTAAATTTG AAATTATTTC 
CTTCAAATAA CTTTTAAGAA CTTGATAATT 
ATATTTAAAA GTTAAAAATC AAAATAGTTG 
ATAAGAAAAA TTACATAAGA TTTGAAAAAA 
TATCTTGTGA ATCCAAAAAA TTATAAAAAA 
AATTAGAATT TCCCAAACCA GAATTAAAAA 
TTTTGCAGTT AAGGTAGAAA TGAATTTTGA 
CACTACAAGG AGGTGTTTAC AAATGAGTAA 
AATTTCATGT^AAATGGCATG TAGACAATCC 
AGCACTAACA TCTGTTGATC AAGTATTAGA 
GGAAAAAATC ACAAAATTAA CTCCGGAAGA 
TGATTCTGAA AAATCCAAAA AAGAAATTGA 
CATAGAAGTA AAGGATACTC CTCGCTTAAT 
TGATTCGGTT TTTCAAACAC TAATTAATAT 
TAATTTGAAG AATGGACTAA AGATGGTGAA 
AAGTAGCAAT GGTGATAAAA GTACCCAAAA 
GTTTAATGCT GAAAATTCAG CGATAAAGGT 
CAAAAAGTGC ATAAAAACTC TTATGACCAA 
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TTATAAATTA ATGAAATTTT AATGCTACTA 3420 

CAATCCAAAT ATAAAGGCTT AAAAACTTAT 3480 

AAACAGTTTG TGGAATTGGT ACAAATGTAT 3540 

ATTTTACTTT ATTTAGAACA TTTTAAGCTT 3600 

TTGXaCTCCA AAGACGAATT CTTTAAAGAA 3660 

ATTTTTTAAC TATAAAAGAA TTTAAAATCT 3720 

AAAAAGGAGA AAAATATTTT CTTTCTTTGG 3780 

TGCGCCCTAT TTGTGAATTT AAAAAAATCT 3840 

AAAATTGAGG TAAAATGGGG CAAATATTGA 3900 

GCCAAAATCG ATTACTAAAA ATAAACCCAT 3960 

TCCAACATTG CTTTCATAGA TATATGGACT 4020 

GTCAATTTCC ATTTGTTTTT GAATTGTATA 4080 

TCCAATTTTG TTATTCATAA ATTTCATAAG 4140 

AGTGCTGATC AAGACCGAAA CACAGTCAAA 4200 

ATAAAAAAAT TCTTAGAAAA GCTCAAAAAA 4260 

ATCAAAGAAG GCGTAATGCC TCTAAGAAAA 4320 

AATCTTTACC CACAAGTTAA TTGTAAAGAT 4380 

GCTATAATTC ACTAAATATA TTAAATATTA 4440 

ACTAATATTG GCAATATCTA TACTGCTAAT 4500 

CATTGATGAA GCAACTGCAG AAAGTAAATC 4560 

TGAGATAAGT GAAGCTACAG GTCTAAGTTC 4620 

GCTAGAAAAT TTAGCAAAGG AAGCTCAAGA 4680 

AGATCAAAAA AATACCAAGG AAAGTAAAAA 4740 

CAAATTGATT AAGAATTCAT CAGAAAAAAT 4800 

AGGTTATAAT GCTACCTATG CAGCCAAAAG 4860 

ATTACTGGAT GAGTTGCTAA AAATATCGGT 4920 

ATACAATGAA CTTAAAACCG TTGTAAATAG 4980 

ACCATTAGAA AATGGTAGTA AAATTGAAGC 504J3 

TGTGGAAACC TATTTCAAGG GCGTGAGCAC 5100 
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CGAACTCAAA GATAAAAAAG l!CGAC AAATA TACTAAAATA TTGGCAGCTT^^GTGAGGC 5160 

AGCCAATAAA ATAGAGAATG CAGCAATGGC CATACATTTG TGCTTTAATA ATTAAAACTG 5220 

GGCATTTTGG TTTACAATTC TAATAAAAAG AAAAATTCTA AAAATTTCAA CTAAAATCCC 5280 

AAAGTAATTT TCTATTCAAA AAAAACACCC GCAATCCTCT TGAAATTTTT TTCAAAGGAA 5340 

TTTTGGGGTT TTTATAAAAA CCATTGAATA TAATCAAATT ATTCCATAAT ATGAGGTTAA 5400 

AATATAATGA ATAATCAAAA ATTTCAAAAA CCTCCTATAG TAAACAATAT CAAAAACCTA 5460 

GCAAGTTTGT TTGCAAACAA AACCAGAGTC ttTTTTTTTT TAATGACAAA TAGAACAAAC 5520 

ACTAACTTTA GAAGAGCCCA AACCATCATA TATACTATTT TCCTTATGCA TCTAAACAGT 5580 

GAAAGCAAAA TCAAAATATA GATAACATAG TGAATTTCAT TCTTGATGAG CTTTCAATAA 5640 

ATAGCATTTT AAATATTGTC GAAACTTTTG CAAAAAAGAA TGAATTTTAA AATATAAAAA 5700 

CAATATTATT AGATATTATC 6ATACCGTGA ATGGAATTGA TCTGAAATTG ACTTTCAAAA 5760 

ATTTTTATGT CACAAGTTCG GGTTCATACT CAAAGATTCG TGTCTCAACT TTTATTAAAA 5820 

TTTTCTAATT C7VATATGATT ATTTTTTTAG AAAGACCAAA GGTATTTGCC ATGCTCCAGA 5880 

CCGATTATCA ATTTCATTGT CAAAAATCTT AACGAAATAT TCAAAAAAAT CAATCTTTAA 5940 

AAGGGATCCT CGACTATTGA CAAAGTTGCC GTTTTAAATT TTATAATTAG AACCGAAACC 6000 

TTTCTATTAA AAACTGTCAA AATCACTTCA AATCATTCTC TAAAATCTCA AAAAGTTACC 6060 

ATAGAACACA TACTAAAAAA TGTCTGCGGA TTTGAATATT GGGATTAAAT TTTGGAACTA 6120 

AAATTTATCA TAAACTTAAT TATTTTAAAT TATTTGATTA GATACAAAAA ATCTTTTGAG 6180 

TATGTCTATC AGTCAATCTA GTTTTAATGT CTTTTTTTTA AAACCTAGAT CATTTTTTCA 6240 

AATTTTTGAA TAAATATAAG AATTTTTATA TTTATTATTA CTTAATTTAT CTTTGCTAAA 6300 

TTTCCTTAGT TTAGTTTAAA TCAATTCAAT CCCATTGAGT ATTTTACACC ATTTTATAAG 63 60 

TTATAAATGC TATATAAAAA CCTTTTTTCA TCTTCTTTTC AGAAGATTGG CAATCGTTTC 6420 

ATTAATATTG CATGTCAAAT AACGTTATTA AAGCATTCCA ATTTAAAAAA ATCTTCTATG 6480 

GAAATTCATT TTATGTAACA CTAATTTCCC CAATTTAAGT TTTATTTTGT TTGGGGCACT 6540 

ATT^TAATAA TTTTTATTAG ATTAAAAATT TTCTAGAATT TAAAGATATA TTTGGATTTA 6600 

TTTTGTATTT AGCTTAATAT TGGTAATTAA ATAATTATTC ATGTTCTAAA TCCATAAAAG 6660 

ACATATAGTC CTTTATAGAT CAAAATATTC TTTATTGGGC CTATTATAGG CCATAATACA 6720 

CTAGGATAGA TATTGGTTTA CTACTATTCA CCGCATTCTT AAAAATGGAA CTTATTTTAT 6780 

TTATTCTGAA GT^GAGCTTA AAAACAAGAA AGTAAACAAA GTTGCTACCT ATTATAAAGG 6840 

CAATATTTAT CTTGCATCTA GATCTCTTGA CAGAAAGAAA AATGGAGCAT ATTACACCCC 6900 
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AGAAGATTTG ACGGAATTTA TGGTTGTGTC 
CCCTTTAGAT ATAAAAATCA TTGATAATTC 
TCTAGATTAC TTAACAGAAA AAGTGTGGTA 
AAATTAGATA TGGAGTATAG AAATGTTATT 
AGTATAAGCC GGAAGACCGT TGTTAAAAGA 
GATATTGATC ATATATCTGT ACAAATCGCA 
TTTTTGAAAC GCCACTAAGC TTGATTAAAC 
GGTATACCAA GGATGAATTT TTGAATATTT 
CAGTTGTAAA AAAGATTAAC GAAATTATGA 
AAGGTATTAA TTATACCATT AAAGAAGATT 
ATCAGGAAAA TGAAAATATA AATAATTTAA 
CGTTGTCTTT TGATAAATCT TTGAATATAA 
TGATTGGAAA TATTTTAGAC AGTAAAATTT 
ATTAGAAAAT TAAGTAGTTA TTATAAATTT 
CAAGAAGGAT TTGATATTGT AATTGGAAAT 
TCTGAATTTT TATCAAAACA TGTTCTTAAC 
AAGATAAAAC AAGAACTACT TAGTAAAGAG 
GAAAAGAACA GTTTGAAAAC TTTGAATAAT 
AGTGGGGGGG TCCGAATCTT TTTAGATATT 
CCGGCGGCAA CTTAACTTAT TTGACTCCTT 
CACTGAGGCA GCATATATTT TCAAATTACA 
AGAAAGGGTT TAGGGCCATG ACCCCTGGCT 
GTAAAGAACC CACAACGAAA TTTAGAGTAA 
TGAAAGAAAT AACCAGTGAT CTGAAAGAGG 
TGGATATAGC TCAAATCAAA AGGCTATCTC 
ATAGCGCTGA GTTCACGCTT GTTAATAAAA 
AGTATATTGA TTTTAGAGAG GGACTAAATT 
ATAATAATGA AAAATTTATA TTTCTGTATT 
GATTTTTTGA AGATAGAGCT GCAAAAGAAA 
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TTCAATTGAA GAACGGCTTA AAACTAAATC 6960 

TTGTGGATCG GGAAATTTTT TAATTTCTTG 7020 

CGAGCTAGAT AAATTTGAAG ATGTAAAAAA 7080 

AATAAAGCTA AAAAATATAA TATTCAAGAC 7140 

ATGTTGCTTG GAAAATGTAT TTACGGAGTT 7200 

ATGTTAGGTT TATGGATTAA TACCTTTATT 7260 

ATCACATAAA AGTAGGAAAT GCCCTTTTAG 7320 

TGGATAACGA ATTTAGAGGT AACTGCTTGT 7380 

CTATTTTAGA AGATATCCAT CAAAAAATCA 7440 

TAGAAAAATC TAAAAAGATA TACAAAGAAT 7500 

GAATAATATT TTCTTTAATT AAACTTTATT 7560 

AATTTAGTGA TATTACAACC GTAATTAATT 7620 

CTAGTGAAGA TAAAGAAAAA ATAGAAAAAA 7680 

TTTCACTATG GAATTGAGTT TCCAGATATT 7740 

CCTCCATGGG AGAAAACTAA GTTTGATGAA 7 800 

TACAGAAAAC TAAGCATAAA AGAACAAAAT 7860 

AATCATCCTT TGAGTATC6A GCGCTATGAG 7920 

ATGTATAGGT TGGTGTTCAG AGAATTTTCT 7980 

TTACGGCTTT CAATTTGAAG CTAGTGAAGC 8040 

CCAGTTTGTG GAGCGAATCC GGCTCTAAAG 8100 

AGCTTAATTA TATATACCAG TTTGAAAATC 8160 

TCAAATTTGC AATATTTCAG ATCAGTAATA 8220 

AATTTGTTAT CCAGAGTAGC GATAATATCA 8280 

GTAATGAAAA TGCTTATAAG GGAATCGAAT 8340 

CTATTCAAGA GTCCATAATA GAATTTAGAG 8400 

TGTTTAGTCG ATTTGATACT CTTATTCAAG 8460 

TAACAAAGTA TAAGGCACTG TATAAAGAAT 8520 

CTGGAGCCAA TATTCACCAA TTTAATTCAA" BS8D 

GTTCTAAATT ACTATGGATA GATAAAAAAG 8640 
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ACTTAGAAAA AGTATTAATGTKaGACAGCC AATATCAAGC CGAAAGAGTA^TCTATAGGG 8700 

TAATTGCAAG TAACACAAAT GAAAGAACGA TGATTAGCAC ACTTTCTCCT AAAAATTGTT 8760 

ATTGCGTGAA TTCAATATAT ATAAATTATG AGGAAATACC AATATCACTT TATAAAAAAT 8820 

TATTTATTAT ATCAATTTTT AACTCATTTG TGTTTGACTT TATAATTAGA AGATTTGTTA 8880 

ACTCAAATGT GCTAAAATCA TGTTTATATC AATGCCCAAT GCCTCAACCC GAAGAGGATG 8940 

AiSATTTTAAA TAACTCTTTA TAGTTAACTT TAGCTAAAAA CACTTCCTTG CTAATAGTTA 9000. 

AAAATGATCC CGATAACTTT AAATATTTGC TTTACTTAGA ATATTTTGAG TTTGGCAAAG 9060 

AAGAAGTTGA CAAGATGTTA AATCTAGACC CCAAAGATGA ATTCTTTAAA GAAAAAGAAA 9120 

ATGAAAATAA TTTCATTGTG GCCAGTCTTT ACTCGTTAAC CAAAGAAGAT TTTGTAACTT 9180 

TGCTTAATGA TTTTAAGGTT TGCAAAAACA AAAAAGGAGA AGATTATATT TCATCTTTAA 9240 

TAAAAGGATA TGAGAATTAT TTAAGAAGAA TGGATAAGCA TAATGCAGCG TAAATAGATT 9300 

TGATGAGCCT CTGTTTGTGA AAGTCTGAGT TTGGTACACA CAGACACTGA AATTATTTAA 9360 

TTTACTTTGT T^AATTTATTT CCACCTAAAT TTCATAGAT^ TTATAAGTGG AATATTCTTT 9420 

GTTATTTTTT ATTGAGACTT TCTAAAACAG TTTTTGCATG TTTAATAAGC TCTTTTATTT 9480 

CTTCCTTTCT CACCATTGGT TCAATTCTTT TAGAGGCAAA AGATTCTAAA TTACTTAAAG 9540 

CACTTCTTGC GTCACTTAAA GCCTGTCTAG ACAATTTTAA TGCATAAGAT CTATTATTTT 9600 

TACTCTCTAA TCTTTTAATA ATGCTTTCTT TTAACCTTTT CTGAGCGTTG TCAAAAAAGA 96 60 

AAGCCGCAGA GCTTATTTCA TTTTCTGCCA TATCAATCAT ATTTATAAGC TGCTCAAGTT 9720 

CACTATCTAT CTTTAAATTA TTTTGCAACA ATTGTGTTAA TTTATTTATC TTATCTCTAT 9780 

TGTTCTTAGG ATTCTCCATT AATGATGTTT TTTTATTGTT AATCTTTCCA ATTACATCAT 9840 

ACAAATCAGC TTTOATTAAA GCATATTCAT CTTTAATTAC ACGTACTTCT CTAATTAATT 9900 

CAGAAAATTT AGAGTTTTTA AGAATATTTT CTTCTAAATA TTTAATTGCT GCATCAGCTT 9960 

CCTTTTCTTC ATTAGTAGAA GGGATTAAAT TCTCCTTTTT TGTCTCTTTT TTTTCAGTAT 10020 

GCGCAATTGA AATATTTGGT ATATTAGCCT TATTCTTTGG TGATTCTGAA GGTATTATAG 10080 

GCTCTATAGG ATTAATTAAA TCCTCATATT TCCGTTCTCC AAAATTTTTA GTAAAGCTTT 10140 

TTTGCTTTTC TTGATTATTA- TATAAATCAT TAAGACCATC TTCTTGAACA CTATCCGAAA 10200 

CTTCTTTTAC ATTATTGTTA TTTTTTTGTT CTTTGTTACT AGATAATTTG GAATCTAGAT 10260 

TACAAGACAT CAATCCTCCC ATTAATAATG CATATAAAAA CAAACTTTT^ CTCATAAAAA 10320 

TATTCTCCTT TTATCAATTA AGAATAATTA TTATAAATAA TAATTATTCT TAATTGATAT 10380 

TATATATCAA TTTGTTCTAA TTACAATAAA TTGTAAATAA AAATATTTTT CAAAAGTATT 10440 
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TAGATATTTA AGATTTTTGT ATAACAAAAT GTTAAGTGAA AAGATTATAT AAATTAGTAG 



10500 



TT 



10502 



(2) INFORMATION FOR SEQ ID NO: 12: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH L 9842 base pairs 
. . (B) TYPE: nucleic acid. ^. ■ * 

(C) §TRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12: 

GAATTTAGTG ATATTGCAGA TATAATCAGT TTAATTGAAA ATATTTTGGG GAATAAGCCT 60 

TCTAGTGGGG ATAAAGAAAA AATGAAGAAA ATTAGAAAAT TAAGTAGCTA CTATAAAATT 120 

TTTCCACTAT GGAATTGAGT TTCCAGATGT TCAGGAAGGA TTTGATATTG TAATTAGAAA 180 

TCCACCATGG GAGAAAACTA AGTTTAATGA ATCAGAATTC TTCTCAAAAC ATATTCCTAG 240 

CTACAGAAGA CTAAGCATAA AAGAACAAAA TAAAATAAAG CAAGAAATAC TTAGTAAAGA 300 

CAATTATTAT TTGAATACTG AATACAATGA AGAAAAAAGC AGTATAAGCG CTATTAATAA 360 

ATATTTATAA AAGTGATTTT AAAGACTTTG CTAGTGGTGG GGATCCAAAT CTTTTTAGAT 420 

ACTTTGTTGC ATTTAATTTG AAACTAATAA AACCAGGGGG TAATTTAACT TATTTGGTTC 480 

CTTAGGCTCT TTGGAGTGAG TCTAGTTCTC TATGTTTAAA GATTTGTCAA AAGATAATAA 540 

ATAAAGTTTA ATTAAAGAAA ATATTATTCT TAAATTATCT ATATATTCAC TTTCCTCATA 600 

TTCTTTGTAT GTAAGTAGCA ACTTTGTTTA CTTTCTTGTT TGCAAGCTCT TCTTCGGTAC 660 

jGAATGAGATA.^/^ TAAATAATAC GATGAACAGT AGTATCTGCA .AT.TJCTTAGGC 2 0 

CATATTCAAG TAGCGTTTCG TATAATTCTC CAAAACTTTT GGGATCTAAC CTTGAATACT 780 

CTACAAATTT TTCATCTTTA ATATTTTTTT CTTCAAAGAA GAGTATTTTA ACAAGTATTT 840 

CTTCAAGTTC ACTAATACTT AGCAAACTTT CATTATTCAA ATATTTAACC TTATCTTCTA 900 

CAAATAATCC TCCATTAAAT ACGGGGAACT TTATTGAATC ACTTCCCTTA TCAAGTAAAT 960 

TAAAAATTGT TATTATTTTT TATATCCTAA TTTCTTTTTT GTATTTTAAT CATAAAAAAA 1020 

TATCTAAAAG ATATAGAAGA TCTGTATAGC TTGTTTTCTT CTAAAATTTT CTTAAAACTG 1080 

TCGTTGTCTT AAATATATGC AATAAAA7UVT ATTCTTAA^ TAAAAATAAT TGCCTCTTTA 1140 



AGTATGCTAG CCAAAATATA 



ACGAGTAAAT 



TCTTTGTci^G 



ATACTTTAAA TTCTTTGTCA 



120-0 



TATATATTTT TTTTACAATT 



TTAAATACTA 



TAGAGTCATC 



AGGCTTCTCA TAAAGCATCT 



1260 
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CTCTAAGAGT TTTTTGAATT tBaTCTTTTT CTTTAACTAT 
TTACATTACT TGTTTTTAGG TAGCTTTCTT TTCTTATAAT 
ATTCTTGTTA TTTGTATTCT TTTTTGTCTT CAATTTTAGA 
TTTTTTCTCC ATAAAGTCTT AGATTTATCA TATAAGCTCC 
ATTCCATAAT GTTTTTGATA TTGATTTAGA CATCTATATA 
ACCTTATCTT TAGCATCAAA ACTAAATACT GGATGCTTAA 
TCTTCAGTTG AAAATATGGG AATTATTTTT TTAGCTTCTT 
ACTTTGTCTT TATCATTTTC AAAAAGTAGT ATATCTACTT 
TGCCCACCTT TTTGTTGTTC TACTGAATAA TTTAGTTCTT 
GACTCTATAT TTGCTTCTGT TGAATTATCA TCTATTGAAG 
ATAAAAAAGT CTOTTAAACT ATTAATACTT TCTTTTCTTA 
TTATAAAGAG ATACATTTGG ATCATTTGTT. TTTATAATGT 
GTTTAAACCA TCATGTTATT TACAAATCCT TTTTAGCCCT 
TTCTCTAAGA TTAGTTTTTT TTAATTAAAA AAACTAATCT 
TTATTTTAAT ATTTACTTGA CTATAAATAA TTTATATTTA 
TTCTCACTTT TTATCAATTC TCAATTAATT AGATTTATTA 
TGATTAAAGA GTATCTAAAA AACACTTTTT TCTTTAATCC 
CCAATTTGTG AAGCATAAAC AAAAAAATGT TTTTATCCTT 
TATAGAGTCT TTTGTTAATT TCTTCTTTAA AAGCATCTTG 
AAAGCTGTGA AAAATTTTTA AAAGAACTTA TCAGTGCAAA 
GGTTTTTATT CATAATAATC CCCTCCCAAA ATTAAAAAAT 
CAATTTTTTA GCAAGTAGTG AAAGTGAAAA AACAAATCAT 
TGAAAATAGG CTTAATAAAT ACCAAAGAAA ATTATCAAAA 
ATAAACAAAT CTAAATTAAG AGGCTAGGCT ATATAAGAAA 
TTTTTTACAT AAATTATTAT TTCTTTACTT TGTAGATAAT 
GAGCTTATTA ATTACTCGGA CATGCAACAG GGATTTAAAG 
TGTCAAATTC CAAAATTTAG ATTTAAAAAT GAAAAAAACC 
ACATTAAACT AGGCAAAACA ACTTAAGCCT ATTAGAAGTA 
CATTAAAGTC AATAACCCTT GAAAATTTAT TTATTCCTTT 
TTAATTATAA TCTCCGATAA AATATCTTTT TTATTTTTAA 
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TTGCTCTTTT TCAACTGCTA 1320 

ATAGCTAAAT AAAATAAACC 1380 

AAAATCAAAT TCAATATATC 1440 

ATACCTTTeC ATTTGAAAGT 1500 

GCTGATCTTC TGCTTCTTTT 15 60 

CTTCCGCTAT AAGTAAGATA 1620 

CTAATTTTTT ATTAAAATCT 1680 

TGGATTTTAC TCCTTCTATT 1740 

CGAAAATAGA TTTTAGTAAA 1800 

AAAGTTTATT TTTTATAAAA 1860 

TAAAGTCTCT TTACAGTTCT 1920 

AATCGGCTTT CATTGTTTAT 1980 

TCTTGATACT CACAATACTC 2 040 

TAGAGCAAGT CGACCAAAAC 2100 

GAATAAGCTT TTAAACTTAT 2160 

TTTTTTTATA AGACACCTCT 2220 

GAACTTTTCT TAAACGCTCT 22 80 

TTCATTTTTA AAATTACAAT 2340 

CTCAGAACTA TATAAGCAAC 2400 

AACAACGC AA GTAATAACCC 2460 

AAATCAAAGA CTTTGATTTA 2520 

CCTAAATATG TAACAAAAAA 2580 

AACAAAAAGG TTCTATTAAT 2640 

ATTTCAAATC AAAGAAAAGA 2700 

TATAAAAACA TAGTGATAGA 27 60 

TTAAAAAACC TAGCATTCAA 2820 

CTTTTCGGGG CATCTTTTCG 2880 

ATAGAGTATC ATTAATTAAG 2940 

TCTTTTTAGA ATTATCATAT 3000 

AAATCTCCTT TAAAACAAAA 3060 
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TATACTCTTT TGGTATCTTT TCTACAAAAA TCATATAATT CATTATCTTT TATTAAAATT 3120 

CTAATTGGGA TATTTTCTTT GTTGTTTGTA TTAATATCTT CTTGATTTAT TTCTGATAAC 3180 

CCTTGTTTTT GTATGGCGTG ATATATGCTA TTAAACCCCG CTTCCTTAAT TTTATCAATA 3240 

GAAATAACAC CTTCTAAAAC CTTTTCATAA ACTTTTAAAT ATGTATAAGC CTGGGTTTTT 3300 

GCAATTATAA AAGATTTTAT AAATTGTTCA AAGCTTTTAA AACCATCATA TTTGTAAAGC 3.360 

TTTTTTTGTT TAATTTCATA TAGAATTTTC ATTCTTTGAA TTTTATTGTC AATATCATCT 3420 

TTTAAATTAA GCTTTAATTG GTCTTTTAGA TCATTATAAA TTATTAAATT TTCATCTTGA 3480 

TTATTATTTA AATTTTGACT TTTATCAATA AAATCTTCAA ATCTATCATT TAAAATGATC 3540 

TCTTTTTTAT TTTTCTTTTT ACTTTCTTTC CCTATCATTT TGCACTCCTA TTGCTTTAAA 3600 

AGCAGATATT TATATGTATT TAACATTAAC TTGCATTTAA AAAATAAGTT TAGACTAATA 3660 

ACATGAGACA AAAACACATA ATAAATCTAA TATCACTAAT ATATGAATAA TTATTGACAC 3720 

AAGTTAAAAT TTGTGTCAAT AATTATTCAC AAATAAAATC GTTCGGTTCT GAACAATACA 3780 

AGAGGATATT TCTAAATCAA AGATTATATA AATAGTGGTT AAAGAAAATC TATTTTTTTA 3840 

GATTGTTTTG ATTATTTACA CCCTGGTTGT TATTTATTAT TCTATTCTTA ATTGAGCCTA 3900 

TTAAAAAGCT TCATTCTAGC TACTGCATAA TAGTAAATGC TTTTTTGTCA AAAAATCACC 3960 

CCCTCTCCCA ATTAGCTTAA ATATTCTTAA AATGGTTTTT GGCTTTAATT TTAACAGAAG .4020 

ATTGAAATTT ATTATTTTAT ATACTATAAT TTTTAACTGT AAATTAACAC ACATTAAGCT 4080 

GAGGGACAAA AAATGAAAGC CGTTATACCT AGTTATAGCC ATCAAATTAA TACCAATAAA 4140 

TCTAATAAAT TACTTTCAAA AGACTGTAAA CTTAAAAAAA TAATTTCGGT TATTATTTAC 4200 

TTAAATAAAG AGTTTGAAAA AAAATATAAT GAATCAATAC ACAGAATTCA • TTTTGAOSeT 4260 

GAAAAACTAA AAGAAATTCG GGTTCATCAT CAAGGAGATA TACTTCGAGT GCTAAACTCA 4320 

AATATACATA GAGAGAATAA AAAAGAAACT ACAATTAATA CTCTAAGAAT AGATTTAAGA 4380 

TTTTTGGTTA AGCTAAAAGC ATTGGAAAAA AGAATGCTAA CATTTTCAAA TAACTTCGGA 4440 

GAATTTAGAG GAAAGCTCTG TATATATAAG GCATCCCCTA TTGCATATAA ATTGATCGAC 4500 

ACATATTTTA GCAACACCAA ATCAGACTTA ATTAAAAAAG TAAAGAAAGA AAAAGATGTT 4560 

TTAAGGGAAA AGAAAGAGCA TTGTAAACCT CAAAATATCA CTGAAAATAT CACTGTATAT 4620 

AATAAACAAT ATATAAATAT ATATAATAAG AATTCTATAG AAAACTCTTT TTTAAAAAAA 4680 

ATTAAATCCA TAGTTTCTAA TACAAAAAAC CCAATTAAAA CACTAAAAAA CACTTTATTA 4740 

AACTATAAAG ATTTTAAAAA TTATTTAAAA TATGATTATG AGGTAAAAGA TATTAAAGAG 4800 
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TTTTTCTTGT CCAAATTAAA CATTTATAAG 
CCCTATAAAA CCGATTTTTA TACTCTTGCA 
TGGAAAGCAG ATAAAATAAC TAGCTTTTCA 
TTATCTAAAA TTTTGTCAAA GGGATTGAAA 
CAAAAAAAGT GATATAGAAA AAAGAATTAT 
AAAAATATAC TGTACAAAAA TATTTAAACA 
AAAAAGGCTA AGACTTACTT TTCAAGAATT 
TTTATTTCCT TTAAGAGAAA ATGATAAGTT 
TGATAGACCC TTTTTTCTTA AAAAAGAAAA 
TTATATAGAG TTTGTCTTTA AAAATGGCTC 
ACTTTTAAGA AAAAATAAAG AAACTACCGA 
AAAAATGGAA AAAAAAGTAT ATGAATTTTA 
AAATAAATGG ATCAAAAAAA ACCAATTGTA 
GGCAAAAGTT CACTTTCTAT ACTTTTTTCT 
CTACTGATTG ATTTAGATCC ACAAAATTCT 
AGTATTAAAA AGTATAACGT TTATGAATTT 
GAAAATAAAA TTAATGAATT TATTTCTATA 
AACACGGATG ATATAGATTA T7UVAGAAATT 
AAAAGTTTTG ATTTTGATTA TATTATAATA 
AAGAATGCTC TAAATGTTAC AGACCATATT 
ATAGAAAGCT TTTCTATTTT AACAGAAACA 
AGATATAATA TTTCTATTAT AGAT^AACCAA 
GTAGAAGAAG TGCTTTATGA AAAGTATGGC 
AATAGTATAA AAGTTTTTAT AAATGACCTT 
AGGGAAGCTG AAAGCGCTTT AAAAAATATA 
TTTTAGAAAT AAAAATTATA AAGAATTTTA 
AAAATTAACd ATAAATTAAT TATTTTTATT 
TAATTGAl^ AAACTTATAA AAAATTCTAA 
TATTAAAAAT ACAAATCTAA AATTAAGTGA 
GTTACATTTC AATAAAATAA AGAAGCCCCT 
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CATAAAATCC ACTTTATGAG AAAAATTGCA 4860 

GGAGAATTTA AAGATATTTA TACTACTAAA 4920 

GGACATGCTG GTACAATAGC CAATAATATT 4980 

TTTGAGTAAT TTGCTTGAAA AACTCAGAAA 5040 

ATTCAATAGA ATTGAAGAAA TAGATAGTAG 5100 

TTTAGTTAGT TTTAAAATTA CAAACAAAGG 5160 

TAATAACAAT GAAGATTTTC TTTTCTTCAA 522a 

CCTAGAAATA AAATATAAGC ATGATAAACT 5280 

TAATAAAACT TATGCAATAA AAAAGCTCTA 5340 

TATTAAAGCC TATGTTCAAT CTTTAAGAAC 5400 

GTATTATCAA TTCAATTTAT CACATTTGA\ .5460 

TAATAAAAAA CTAAAAGATG GGGGGGTTAT 5520 

ATTACACTTG CAAGTTT7UUV AGGAGGAGTC 5580 

TATGTTTTAA AAGAATTGGG GAAAAAAGTG 5640 

TTAACTTCTT ATTTTAATAA GTATATTTCA 5700 

TTAAAAGGAA ATACGTATTT TGATAAATGT 57 60 

ATTCCCTCTC ATCCTATTTT AGAAAAATTT 5820 

ATTTTAGAAT TTAGATTAAA TAAGAGCACC 5880 

GATACTTCTC CTAGTAGGAA TTTCCTTTTA 5940 

ATAATCCCAG TTCAAGTAGA AAGATGGTCA 6000 

ATAAATAATA TTCAGATCAT TAAAAACAAA 6060 

TTTATTAAAA ATAGGAATAC CTTAAAAGAG 6120 

AAATATATAA AAGGTAAAAT TCACTTTTCA 6180 

TTAGAGCCTT CTTTGAAAGA AATTTATTAT 6240 

CTGTAAATCG CTATTCTGCT AATTGCTGGA 6300 

CCTAATTGGT TTTGATGATC TTAAAAATAT 6360 

GTACGAAGTT GAATTTTAGC ATCAAAAAAC 6420 

ATATTTGAAT TAGAAGCTTA TCAATTGTAG 6480 

TATTCTTTAG ATTTACAGTG GCTTTAGCAA 6540 

ATTTTTAGGG GCTTCTTTAT TTTATTGAAA 6600 
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TGTAGTATTT 


TAGTTTCAAT 


TGTTAGGTTT 


TTCTTTTCCA 


AATATTTCTT 


CTTCTAATTC • 


6660 


TTCGTCTTCT 


TCGTCTCCAA 


AATCTTCTCT 


ATCTAACATC 


TCTTGCTCTT 


GTTCTGCCTC 


6720 


TAATTCTGCT 


TCTATTCTGC 


CATCAGGATC 


ATCTACAAAT 


TCTGCATCTC 


CGCCGCCCGG 


6780 


TATCGGACTT 


CCTAATAGTG 


GTTTTTTCTT 


GCTTTTTAGT 


AAATGTTTTT 


TAAGTTCAGA 


6840 


TAATCGAATT 


ATATATATCT 


TATTATCTTT 


AAATTCTAAT 


AAAATATGAT 


CATTATGTTT 


6900 


TTTTATGGAA 


GTTAATTTTT 


TATTATTATT 


GCCAATATTT 


ATAACTTTTA 


AAGCTGTTTG 


6960 


AATTCCAAGA 


AGCATGGCTT 


TTTTAAAATC 


ATATCTTCTT 


TTAGATTTTA 


CTTTAAAAAG 


7020 


CTCTTGATTA 


TTAATACAAT 


CTTTAATTAT 


AATTCTGCTA 


TCTTTTTCTT 


TTATGCAAAG 


7080 


TGTAGTGTTA 


GTACCTTTTT 


CAGTGTCTAT 


ATTTTCTTTA 


TTGATAGGAT 


TTGAAACCGA 


7140 


TTTAGCGGGT 


ACTTTAAAAT 


TGTATTTTTG 


GCGTGATCGA 


GAATCTTTTG 


AAAAAAGATT 


7200 


GCATGAAAGC 


AATAATAAAC 


ATAAACTTAA 


ATTGATAATA 


TATTTTTTCA 


ATTTATAACT 


7260 


CCTTAATTTA 


ATATTTACTT 


TATTTAAAAG 


TATATGTTTA 


ATTTTTTATT 


AACTATTTCC 


7320 


CAATAATATT 


GATATTATAA 


TTAATAAATA 


TCTTTTTTTA 


AAATAAAATT 


TTTATAGAGG 


7380 


TAATAAAAAA 


TATAAGTGCA 


AAAATATAAT 


CTCATAAGGA 


TGCTATTAAA 


AGCGGAGCCG 


7440 


AAACAAAAAT 


GATTTTTTAT 


TGATTTATTT 


TTAGATGTAA 


TGAGATAAAA 


AAAATTTCAC 


7500 


TAGTTTTTAT 


ATAAGCTCGG 


GTTCTAAGGG 


AGCTAAAGAA 


TTAATTAATT 


TGTTTCTTAA 


. 7560 


GATTAAGACT 


TGGACAAACA 


ATAGTTTATT 


TTAACCGGGG 


GGTATAAATG 


TTATTTATTG 


7620 


AGAAGATGCA 


TCAATATTTA 


CACATATGGT 


TTCCATAAAT 


TAAATCAATA 


GTAACGTTTT 


7680 


GCGTTATTAC 


AGGATATTAT 


TTATGGTGCT 


TGTGCCTCCA 


AACAGCAATC 


AAAAACTACT 


7740 


TTTTGCTTAA 


GGATTTAATG 


CATAAAATTT 


TTAAAATAAA 


AAACTGCCAG 


ACACACAATT 


7800 


AATAATCCTT 


AATAGATAAT 


AACAGACAAA 


AAACTTTTGA 


GTTCCTTCTA 


CAATTTTATC 


7860 


GCTTAATTTT 


TTAATCTTTT 


TTTGCCTTTT 


TATAATAATT 


TAAAATTAAT 


AATCTACAAA 


7920 


ACAAAAAGAA 


TCAACATCAA 


ACAGTCCTTT 


ATCATTTATC 


TTTAAATGGG 


GAACCACCGT 


7980 


TAAAGACATA 


AAAGACAAAG 


TCA.TTAGAGG 


ATCATCAAGC 


CGAGAGCCTA 


AAACATTTTT 


8040 


ACAAAAATCA 


TTTAATTTTA 


TATATTGTGA 


AGCTACTCTT 


TCGGCTGAAA 


GAGTACTCAT 


8100 


TAATCCAGAA ATAGGAAGTT CCATTATTAT AGTTTTTTCA TTGTTTAGTG CA.CATAAACC 


8160 


CCCCTTATTC 


TGGATGATTG 


TATTTGCCGC 


TTTACACAAA 


TATTCATCAT 


TGCTTCCAAC. 


8220 


AAGTATGATG 


TTGTGAGAAT 


CATGAGCAAC 


TGTACTTCCT 


ATGGCGCCGT 


TTCTTATTCC 


8280 


AAAATTTTTT 


ATAAATCCTA 


TAGAAATTTT 


ACTATTGTCT 


TTATATCGAT 


TTATTATAGC 


8340 
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TATTTTTAAA ATATCCTCGG CAATATTAGA TTGAAAATCT GGGGCCAATA AATTGCTATC 8400 

AATCATAGTT TTATGAGTAA TAATTTGGTT GCTGATGCAT TTGATTACTG GGATCATCTT 8460 

ATTTTTAGTG GAAAATTTAA AATCCGAAAT AGATTTTTTG CTACAATTAA AATTGTTTAT 8520 

AGGAATTTCA TTTATTAATG GGATAAGTGA AATTCCATCA TTAAAAACCA ATTTACCATT 8580 

AATGTAGGTT TTATTTATTT TGAATGTTTT GATATCTTTT GTAATTATAA AATCAGCAGG 8640 

ATCTCCTATT CTTAACAACC CCACTGGGAT TTTATAGTGT AAAACCGGAT ' TAATGCATGC .8700 

TATTTTCAAA ACATCAAAAA AGTCGTGCCC ATGCTTTATT GCACGAGCTA CTATTAAATT 8760 

AATATGTCCA TTTAGAATGT CATTTGGGTG TGCATCATCA AAACAAAACA TTAAGGAATC 8820 

ACAATATTTT TTAGAACATT CACTAATCAA AGGATGCAAA GATTCAAAAT TTTTAGCGGC 8880 

ACTTCCTTCT CTAATTAGTA TTTTCATGCC CAAAGATAAT TTATATCTTG CATCTTCTAT 8940 

TGTTAAACAT .TCATGATCAG TGCTAATGCC TGAAGATGCA TACTTTAAAG TTAAATTGGG 9000 

GGACAAACCA GGAGCATGCC CATCAACAAC CTTATTACGC TTTAATGCAG AATTTATTTT 9060 

ATTTATAATT TCAATATCTT TGTTAATCAC GCCTTTAAAA TCCATTACTT CAGCCAAATA 9120 

GTAAATATCA TCTAATTTCA TCAATTCATC TATATCTTTA TCATTTAATA CATATCCTGA 9180 

AGTTTCAAAT TCTTGTGACA ACGCTGGCAC ACAAGAAGGA GCTCCAAAAA AAAATTTAAA 9240 

CTCGGTTTTT TTAGAATTAT TTATCATAAA ATTGATGCCA TCAATACCAT TAACATTGGC 9300 

TATTTCATGA GGATCGCTTA TTGTAGCCAC AGTGCCGTGT GCAACTACTA AATGAGCAAA 9360 

GTTTGATGGA ACAAGAAAAG AACTCTCTAT ATGTATATGC GCATCAATAA ATCCTGGCAG 9420 

CACATATTCA TCCAATGTCG CATTAATTTT TTCTATGCTC GCAATATGAC CGTTTGCAAT 9480 

CGCTATACTA GCTGGATAAA TTTCTTTATT AAAGATGTCA ATATAATTAG CTTCAATTTT 9540 

AAATAAATCC ATTATTTATC CTCTCCTAAA AACTTTTTGT TCATAATATA CTCTACCTTA 9600 

AAATCTTTAA ACTTAAATTA TAGCGCAAAG TGCCAGTATA TTTAATTGCA ACTGTATTTA 9660 

GAAAAAATAA AAATCGTCGA TATTTGTTAT ATACGATAAA AATCGAAGAT AATTTTTTGG 9720 

GTAAAATAAA TAGAAAAAAT TTAAATAAAA AATAGCTAGC AATTCTAATT TTGATACCAG 9780 

CAAAGATTAT GTGGTAAAGT ATCAAAGGGG ATCCTCTAGA GTCGACCTGC AGGCATGCAA 9840 

GC 9842 
(2) INFORMATION FOR SEQ ID NO: 13: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9542 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13: 
TGAAAACCCT AAGGATGAAC TTGCCGGGGA TTGATAAAAA TCTTAAAGGT TATGGCTATA 60 

AGTATCAGAA TTTCAACGAA ATAGCTAGAG AAATTAAAAA AGTTATTGAT AAGCACAATT 120 

TATGCCTTGA TTTTAAGCAA TTTCCGACTT TTACAGTTGT GGGGGAGCAA CAAGTTCTAC 180 

ATGTTGTTAG AACTACGTTT TATAGTACAA ACACTGGGTA TAAAGACTCC TTTGATACGC 240 

CAATACTTAC AGAAAATTTA AAATGGAATA ATGAAAATGG GTCTAAAAAT GTTGTAAATA 300 
CAGTGCCACA ACTGGTAGGC TCATCAATTA CTTATTTTAA AAGATACGCA TTAGTAGCAT ' 360 

ATCTTAACAT AGAAAGTGAA GTGGATACTG ATGCAGCTCC TATTTACAAT AACCACGAAA 420 

ATGAAAATTC TATGCCTAGC AAACAAGCTG GTGTTAACCA AAATCAAGTA AAAAATTTTG 480 

ATAAAAAGTT AAAAACCGGA AAGTATTATT GCTATGAACT TTTTAGAATT GCTTTATTTA 540 

ACATAAAAAA CTGGGTAAAT GATGAAAAAG AAAAAAATAA TATAAATGCT CTTATTCGGG 600 

CATTATGTTT TGAAAATGAG GCGGATTTAG ATGAAATTTT TAATGATAAT CCTGGGTTTA 660 

AAAGCATACA ATATTGGGCA AATATTCTTT TAGAATATTT CAAGAAAACT AATAAATTAG 720 

ATGAACTAAA TAAGTTTGAA GACTTTATAA CTAATAATCA CGACGTTTAT GAAACAAGTG 780 

TCTTGAAATT CTTTTGCATG TTAAAAAAAG AAAGACAATT TGATTATATA TTTGCAGTGT 840 

AATAATACAA ATAAATCCCC CTTAAAGGGG GAAAATATTA ATCAATTATT AAGATATTTT 900 

GGCTTTTCTA CTCGCTTTAT ATAATGCTAT CTATACGCCT CATAAGGTTA TAAATTATTT 960 

CTTTTTAAGC TATTTTTAAA ACTTAATCTT TAGGCAAGTC TGCCAAAATT TGTTTTAATA 1020 
TTTGTTTAAC TGCCGT-TATT TTATCTTTCT TATAAGATTC TTCAAAATTC TCTCTAGCTT ^ 1080- 

TTTCTCCATA TTTTTCGGCA TAATCAATTT TATCCGAATC TAATTGTATT AAATAATCGA 1140 

AAATTGAATT TGGATAGCCC TTTATGAGAC TATTTATGTT CATTATAATA AAAGATAAGA 1200 

AATCAGTTGT TATTTTGCTT TTTATAAAGC CCACAACATC AAGTGCGTCT AATAAAACGC 1260 

TATTTTCTTT AATTCCGATT TTTCTTAAAC TTCCCCTAAT TTCTGGAGCT TTAGCAAAAA 1320 

AAAAGCTTTT ATCATATTCA CTTTCAAAAT CATAATTATC TAGTCTTTTG TTAAGTAAAT 1380 

CATAATCTTC TTTAGAAAAA GCTTTTTTAG CTTTCTCATA ATTTTTTTTT ATATCTTGAC 1440 

TCATAAAAGC ACTTAAATCA ATGCTTAACA TAAATAATAA AAATAACAAT AGGCTTATTT 1500 

TTCTCATATC CTCTCCTAGG CTTTATTATA TACATTCTTA TTAGCAATAC TAATAAGAAT 15&0 

TAGAACAAGA CTAACAAATA GTCTTATTTG GTGTTCGCAA ATTAAGCATT GTTGATTAAG 1620 
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AAACTTAA TAATTAACCA AATAATAAGA 



ATTTTGGTAA TTTTTATTTG CTAAACTTAA TAATTAACCA AATAATAAGA CCATTAACAA 1680 

TAATAGAGAT AAAGGGGGTT ATTATTGTGA AAAGAAAAAC ACTCTTTCTA TGGTACGCAT 1740 

TAAATTTTTG TAAACAAAAC GCTTTAGTTT TATAAAGATT TTTTTGAATA TCTTTAATAT 1800 

CTTTTTCTAA ATTAAATATT . TTAGTCTCTA . AACCAGCAAT TTTCCTATTT AAGTTAGAAA 1860 

AATTCTTTTG TGAAAGATTT TCATCATTAT TTATTTTAAA CTTGTTATTA TCTACCATAA 1920 

GAAAAATCCT TAAATTTTGT CTAAGTTACT AGCATTAATT TTCTAAAGTA TGAATTATTG 1980 

TTTCTTGATG TTTATAACAT TGTTTACAAG AAATTAAT^AA CATAATAAGA ATACAAAAAA 2040 

TAAAAATTTT ATTTTGCATA GGGCCTCTCC AAAAGTTAAA AATAAAGCAA AATTATTTAA 2100 

TTGTAAAACA ACTAATTTCA AGATATATTA TTGAAAGTAA AACATAAAAA AAATTCAAGA . 2160 

AATAGTTTAT ATATTTTTGC AATAATTCAG AATGAATTTT TTAAGGATTT AAATATCTAA 2220 

TTTGTTACAT TTTGCTATTA CATATTAACA. AACTATAAAT ATAATAAAAA TGAAATTTTA 2280 

GGAAGTTCTT CATTATAGGA ATTAATCTTG TTAAAATGGC TAATAAATGA CATATAGTAC 2340 

AAATTTAGTA GTTTTTTATA TAAAATAGTC GTAGTATATC ACATATTCAG TCTAATTCCC 2400 

TTGAAACTAC CACTTTTGTT TATTTTAACT TCTCTATAGC CCTAATTTTG TATTTAATGT 2460 

TAGCACTACT AGCTATTCTA GCCCTAATAT TTTTTGTTAA ATTTTGACTT GTAATTTTTA 2520 

CTATTTTTTT AACTTAAAGT TTACAACTTA GAACAAAATA GTTTTTGTAA ACTCAATATA 2580 

TTTATTTGTT TTAAATAAAA AAAATTAACA AAAACTATTA AATAAAAACA AT^TCTTTTA 2640 

ACTACTACTT TAGAGTAGCC AACTTGATAA AGTCTTTTTA TAATGAGCAT TATCACTTTA 2700 
CAAGTTTTAT TTATAAAGGG GGATTTATTA TGACTCAATA TTTTAATGAT GATATACCAT , 2760 

GCAATTCTTG CAATAGATTA ATTAGAAAAT ATGACCAAAC TTGTGTCGCT TGTGGGGCTA 2820 

AAAATAAACA AAATAAAAAA TCTTATTATG GATTAATAGC ATTTTTATTT TGTCTATTTT 2 880 

TTGGCTATTT AGGATTTTCT AATTTGTATT TAGGCAAAAA CCCTAAAATA GGTTTTACAT 2940 

'TTTTATTTAT ATCTATTGTT TTTTTGTTAC TTGCAGTGCT. GCTACATAAA TCAAACAAGA 3000 

CTAATTATTT ATTAGTCTTG TTTGTACTGT TAGTATACTT TTTTTTTGTA AATAGATTTA 3060 

AAATCTATAA ATTTTTTAAA AAAGTAACAA GAAAAATAAT TAGTCTCTAA GAAATTAGTA 3120 

ACAAAATCCA TAAAAACATT TTCATAGTAG TTACAATTTC TAATGTCTAT AAAAATTAAA 3180 

CCAAAAATAT ATAAATATCA TATATATATC CTCTTAATCT TCAAGTTTTG GGGGTTTTGG 3240 

CATAAAGTCT ATGTTGCGTT TTTGTGGTCA CTTCAAATTT GCATTTTTAC TTACTAAATT 3300 

GCTCTAGTGC TCTAGCTCAA ATTTTGCATA CAATTAAAGT TAGATAACTA TATTAAGTGT 3360 

GTAGTAATAG ATATTTTATC TTTTAAGGCT AAATATTTGT TGTTCTTTAT TTAATCTTCT 3420 
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TCAAGATATT TTATTATACT GTCTATATGT GCTACTACGT CTTCAGATAG TTCTTTTATG 3480 

TTAATAGCAT GGAGTGCAAT AGGACTGGTA TTTACTCCGG CTGATAGAGC TATTGAGCGT 3540 

ATTTTGAGTT TGTTCTTTTC TAAATCATCA TTATCGTTTG CATTAAATCT TTGGATATCT 3600 

ACTCTTACTG CTTTTAAGGC GTTTAGTTTG GATGTTAGTT TTTCTTGAAA AAGTTTTTGT 3660 

AAATTTAAAA ATTTTTCTTC GAATTCTTTA GCATTAGTTG CATATTTTAA GTCTTCTTTT 3720 

AATAAGCTTA TTTTTTCTCT ACAATGTTTA AATGCAACTT CATCGGCCTC ATCATTAAGG 37 80 

CCTGAGACAC TCATAATAAG CCAATTTATT CTTTTTTTTT CTATTGTTGT TGTTTCTGTA 3840 

ATTGTTGCTC TCCTTTTTAT TATAAATAGT TCACAAGATA TTACAAATAA TGAAAATATT 3900 

AATATAAAAA TTAATTTAGC TATGTTTATT TTTTGCATTG ATTTTTCCTT TATTTAATAA 3960 

TGAAAATTAA TACAATACAC AAATAATCTC AAAATTTTAG TGAATTTTTT GATATCATAG 4020 

AAACTATGAC ATAGAATTAA TATAAATTAA TATTATTTTA TTTTGATATT TAATTTTGTT 4080 

TGATTTAAAA GTGGAGTTAA TTAATGGAAA TTGATAATTT TTTAGATTTA CAAAAAATCA 4140 

CCGCAGAAGT ATTGCTTAAA ATTCACGAGG ATAATCAAAA T^TACTACAA ATAATAGATA 4200 

AAAATAAAAC GTTAAAAAAT AAAATAAAAA AATTAACCGA AAATAAAAAA GAAAATAAAC 4260 

AAGAAAATTC TAAAACCACT GCTAAGTTGT ACTTAAATCC AAAAACTAAT CAATTAATTA 4320 

TAAAATGTGT CAAGACATTA AAACAAATTG ACCCAATAGC TGGATGGTTT GTACACCTAC 4380 

TGGTAATAAG TGGGTGTAGG GGGGCCGAAC TGCAAAAAGT AAAAATGCAA GATATTTCAA 4440 

CTTTTTTAAG CAAAACCGGA AAAACTTTAT ACAACATAAA AGTAAATGTG GCAAAAAAAA 450^0 

AATTTACTAC TTGTACTAGA GAATTTGTTA TAACCGAAAA AGAATTTAAT GCTATTCAAA 4560 

AAGTACACGA AATTTACTTC . AAAAAGAAAA Ag?.CCTAATAC^ TAGCCGCACT- TATTTTTTTC 4620 . 

AAAAAACCAA ACATAGGTTT AAAGATAATC GAATTAGCAT TGACTGTATT GCTAAAAAAT 4680 

TCAAAAAGTT ACTTAGAAAA TGGGGTTTTG AAGCACGTAA ATCACTTCAT TTATGTAGAA 4740 

ATTTGTTTAT TTTCAATTTA AAATCTAATG GCTACAACTC TTTTCAAATT AAAGAACTTA 4800 

TGAAATATTC TTCAACATAT GAAATTGATA ATATTTATGG ACTATCTCAT GCAAGTAAAA 4860 

TTCAAGCGTA TGAGTGCATA AAAAATAGTA TTGCCTTATA GCTTAACCAG TTAAGCTTAA 4920 

ATGGTGAATA TCTTTATTTT TGACATATAC TCCTTTATAA TCCTTTACAT TTATTTATGT 4980 

ATTTCTAATA ATCTTTATCA GTGTCCCAGT CAATAGGGGC ACTGATACTA TTTGTAAACG 5040 

CTATATTGCT AAGAAAGAAT ACTTACTACT TATTGGCAAA AACCCCGTAA ATCTATCTGA "SiaO 

TATTGCTCTT TTATTCGGAT CATAATTAAA CACAAATTCT CTAAATTTAT AATTCACATT 5160 
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ATTAATTAGT GGATATTTAT GCATAATCTC ATTAATTTTT ATTTTGAGCA GTTCTTTTAT 5220 

AGGATTTTCT TTTTTTTTGT TTTCAATTTG AATTTTATTT AACTCTAATT TTAGATTTTC 5280 

AATCTCAAAA ATAGAACACT CAAGATTTAT AGCGGCCTCA TCAGTTCTAA TTTCAAGGTC 5340 

TACACAATCA ACATATTCTA CAAATTCATT TATCCAGTCA AACTCAATCC CATTTTTATA 5400 

AAAATCACTA TTTATTACTA AATCTTGAAC AAGATTTATA AAAGTATCAT TATTCCCATT .5460 

ATGAGATATT AATAAATTGA CCGCCTCATT TTTAAAAATT TTATTTCTTA AAT TGGAAAC • 5520 

TTCAAATTCA CATTTATTAA CAAATTCAAA CACTTTTGTT ATCAAAAGAT TATTTCTTTT 5580 

AATTCTACAA TTAATAGGTT TATTACCTAT TAAAAAGAAC AAATTACAAT ACTCAAGCCC 5640 

AGTGCACGCT AGCTGCACTT GTGCTTGTAC ATAATATTTG AAAAAATATT TACTACTTAA 5700 

AAAATTGCCA TTTTTATTGT ACTCAGCAAT AGCACTACTC ATATAATTAG AGTCGCTACT 5760 

TTTAATCTCT AATAGTTCTA AATCGCCATT ATTATTAATA AACCAGCCAT CAATTGTTGA 5820 

GCCCACTAAA GTTTGTGAAC TACCCATTTT TTTGAAATAG TTATACTTAT CAACACCGTT 5880 

AGCATATTTG TTTTTATACA AAATATCAAT ATTATCTCCG TGTGCTTTAA TAAATTCTCT 5940 

AAATCCTAAA TTCTCTAACT CTTTGCCCTT GAGCATATAT AAATTCTCTT CATAAGGCAT 6000 

ACTTATACCA AAATATTTAA GCAGTCTATT CATCATTAAA TCTTTTAACC CTACACCACC 6060 

AGTTAGAATA TTGCCTACTT CACTAGCACC GTATTTATTA AGTTTGTTTC TTTGCACACT 6120 

AAAATCAATA TTTCGATTAA ATCTAAAACA TTCTTGACTG CTTATTCCGG GTAATTTCTT 6180 

ACCTATCTTA CTTAATTTAC TTTTTTCTTT AGTTTGATTA ACTTGATAAT CAAGTTCTAT 6240 

AAAATTTTCA AAACCAATAA AATTAGTTTG CTTATTTATT TGATTAATTT TTTGTGGATT 6300 

ATTGTTTAAG TTTTTCATTT TTTTACTCCG CAAGTTATAA TTTTCTTATA TATAAATATA 6360 

TAGCAAAAAC TATTTTTGCC AACTTTTTTA CAAAAAATTT TTTATTAAAA CACTTAGGGC 6420 

TTTACTAAAT TCTCTTTTAA AAGAACTTAG AAAAGCCCTA TGGATTTAAG AACTGATTAT 6480 

ACTTACGTAG TAAAAATACT ACAGATATTA ATAGTATAGG CTATGTTAAA ACTATAATCA 6540 

ATTTATATTT ATATAATCTT GTAGCTTGAA AAAAATATAA AAACATTTTT TTGTATTTTT 6600 

TTTATAAAAC ATTAACTTTT AAATCAAAAA TATGTTATAT ATTTATATAT AAGAAAATTA 6660 

TGACTTGCGG AGTAAAAAAT GGAAAATTCT AAAAAAAATA CCCTTTGCCA AAATAAGACA 6720 

CAACATAAAT CAATAGTTCT TATCTCAACA CTAGAGTATA TXAACAAAAC ACATAATAAA 6780 

TACACACAAA AAAACATACT CTATTACTTT AATGAAAATC TTAAAAGAAA TGGTCAACTA 68 4 Q. 

CCCGTTAAAA TAAAAACACT GCAAAATTAT CTTTACAAAT TAGAAAAAGA AATTAAAGTA 6900 

ACAACTAATT ATCACAAACA CTTAGGAGTA AATTGCGGCA CCGAAATATA CTATCAACTT 6960 
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TTAAGATTTC AAAATAGAGC TACAAGGGGC CTTAAAGATA GATTTACTAA AAATGGGAGT 7080 

GTAGATTTAA AGGAGTGTTT AAATAATAAA AATAATATAA AAGAAGAAAG AAAGATTAAT 7140 

GAAATAGAAA AGTATCAAGT AAGAAATTAC TTCAATAAAT GTAACTTTTT ATGTAAAAAA 7200 

ATTCTTTCAA TTTTTCTTAC AATTTTATTC AATTTAGATA TTGATAAAGA TAATATAATC 7260 

AAAATACTTA AAATCATAAA AATAATAGAA ATTAAATTGC TAAAAAATAA AAATATACAT .7320 

TTTACTAAAT CTTGCATGAA AGAAAAACAA GAAAAATTAA AGAAAATTCT ATGCAACACT 7380 

CAAAAAGAAT TTGAAAAAAA TGAATATAAT CCTAAACAAT TAGAAATAAG /TTTCCAAAAA 7440 

ATATACGAAA ATTACAAATT TAAGCCTCAT TTTATTATTG AAAGTCATAA ATATAGCGAT 7500 

TTAAACAATA TAAAGCGTAA ATTAGAGAAG TCAATTGAAA GAAAAAAAGA AAATTCTCAA 7560" 

CAAAATTATC AAGATTTAAA AACAAACaTT TTCAATATCC TTATTGAACA ACTAAAAAAA 7620 

GAAGTAAATA TTGAACTTCT AAAGCCAATT ATAAAAGAAT ATTTGAATAA CCAAAAGTU^ 7680 

ATAGAATACA ATAAAGTGTT TTGCACATAT TATTGCX5AAT TATTAGAACT AATAAAAAAC 7740 

CAAAAAAGTT TATTGAATTT AAAAGAATTA GATAGAAAGG CTATATAAGG ATTTAATATG 7800 

GAAAATTCAC TAAAAGTTGG GCAAACATAT AAAGAAATAA TTGATATAAA AAGAAAAAAA 7860 

CGATTTATTA AAATTGAAAA AAAAAATAAT T^AAACTGTGT ATCACACTAA GATAATGATG 7920 

GATATTCATA AATTAGGAAT TGTTAATGTT AAAAAAAATC AATTTCGTGT GTCATTTAGA 7980 

GAATTATATA ATCAAATGGA AATTCAAGAA ATTCGCGTAT ATCCTATAAG GAAAAAAGAT 8040 

AAATTTTTAG GAATTTTTTA TGGCTATAGA AAACCAGTAA AAAATGTTTT TGTAAGATAT ' 8100 

AGAATGGATG .GAGTTAAAAA AGTATATTCA TTTTCAAAAA CGTATTACAT AGAGTTTAGA. . , .8160. 

TTTAAAGCTG GTAGTGTTTT TTGTTATTTA AAGGGTATGA GGCGTTTAAC AAAGAAAGAA 8220 

AAGATAGATA CACCCTATAA TAAAGCACTT TTTGATAAAT TGATAGATTT AGAAAAACAT 8280 

GTATATGAAT TTTACAATAA AAAATACCCA GAACAAGGAT TAATTCTTAA GTGGATATTA 8340 

AAAAATCTAA AATAGTAACA ATAATATTAA TTAAGGAAAA TGTTGACAAA AATAAAGGAA 8400 

AATTTTTATG GAAAAAAAAC GTGTTGTTAA AGTTTTAACA AAAAAGATAG ATACTTATGT 8460 

TGAACAAAAT TTAATGATTA ATGAAAGTAA AATTTCTTAT TACAAGACAC TAAAGGAAAA 8520 

GTTGAATGAC AATTTCAAAA AAGAAATATT CCACAGGGTG GAAAATATTA AAATTTTAAA 8580 

AGAAATAAAA GATAATCAAT ATTATAAATT TGATGGTTAT AAAACTTTTC TTGATTTTAT 8640 

AAAAGACTTT GATGTAGCAA AAACTCAAGC GTATAAGTAT TTAAGATTAG CAACTGCACT 8700 
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925 



GCAAGAAGGG CTTATAAAAG^KGATTATTT AATAGAAAAT 
TTTTATAAAA GATAAAGAAA GTCCGGCGTT AAAAAAATCT 
ATTAAGATTT CAACTTAAAA CTCAAGAAAG TTATGATTTT 
TACAGCGTTT ATTTTGGAAG AACTTCTTAA AAATCAAAAA 
AAGGAAATAT GAAGAACTAA AAATCTAATT TTAGAATTTT 
GTTTTTATAA GTTCTTTTAA AATAAGATTT TATAAAAGCT 
AGACCGCAGT GTAATAATAT TAATTGATTT TAATTTAAGG 
TTTTGTAGGA AATAATTTTT CATTATTTCC TACTTGAATA 
GGCTTTACTA AGTTCTTTTA AAAGAGAATT TAGCAAAGCC 
TTTTATTAAA AAAAGTTGAC AAAAATAGTT TTTGCTATAT 
TAACTTACGG AGTAAAAAAA TGAAAAACCG CAAAAACAAT 
AGCAGAAATT GACTTTTTAA GAGATATGAA AACCCTAAGG 
TAAAAATCTT AAAGGTTATG GCTATAAGTA TCAGAATTTC 
TAAAAAAGTT ATTGATAAGC ACAATTTATG CCTTGATTTT 
AG 

(2) INFORMATION FOR SEQ ID NO: 14: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 93 99 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



PCT/US98/12764 



GGTATTAAAA^WTCTT ATAA 8760 

AGGCAAAATC CAATAAAACC 8820 

TACAAAAAAA ATGCTAAATT 8880 

GATTTTCTTA AAAAACTTTT 8940 

GTAAATAATT TAGAGAATAG 9000 

TTATATTTTT GTATTTTTAT 9060 

TTGAACTAAA CTAAATATAG 9120 

TTGGATCGTA AAAATATTAG 9180 

CTAAGTCTTT TAACAAAAAT 9240 

ATTTATATAT AAGAAAATTA 9300 

AATCCACAAG AAATTAATCA 9360 

ATGAACTTGC CGGGGATTGA 9420 

AACGAAATAG CTAGAGAAAT 9480 

AAGCAATTTC CGACTTTTAC 9540 

9542 



(xi) ' SEQUENCE DESCRIPTION: SEQ ID NO: 14: * 

TTATTACATT CTTTTAATAA AGATTTACGA TTCTTAATGC TTGGATCTAA GCCTTTTTTA 60 

AAATCAATAT ATCCTTCACC AAGAGCACTA AATTTGCTTU^ ACATTTTATT AATAAGAGTA 120 

AATTCTTCAT TGTCTTTGAA TTCTATTATT GATTCTTGAA TAGGAGATAG CTTCTTAATT 180 

TGATTTATAT TTAATTCAAT TCCTTTATAA GCATCGTCTT TACTATCTTT CAAATCCCTA 240 

GTTATTTCTT TTAAAATATT ATCACTACTC TGAATCATGA ATTTTGCTTT AAAGCTCGAT 300 

GTAGATTCTT TAATATTACT AAGTTGAAAT ATTGGAAATT TAAAACTTGA ATGCACATCT 360 

TTAAATCTTT TTTTGTTTTC AAATTGATAA A^TAGTTAA GTTTATAGCG AGCAAATATA 420 

TGTTTTCTTA GTATTCTAGA ACTAGATTCA TTCCAAATAG CTGAAGGAAC TAAATAAGTT 480 

AAATTACCTT TTTCTTTTAT TAATTTTAAA TTAAATGTAA CAAAGTATCT AAAAAGATTT 540 
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GGGTCTCCAC CACTAGTAAA GCATTTAAAA TCAAATTTAT AAATATTATT AATGGCAATT 600 

ATACTATTTT TTTCTTCATT GTATTCAATA CTCAAAGGAT GATTATCTTT ACTAAGTATT 660 

TCTTGTTTTA TGATATTTTG TTCTTTTATG CCTAGTTTTC TGTAGTTAGG AATATGTTTT 720 

GAAAAAAACT CTGTTTCATT AAATTTAGTT TTCTCCCATG GAGGATTTCC AATTACAATA 780 

TCAAATCCTT CTTGAATATC TGGAAATTGA ATTCCATAGT GAAAAAATTT ATAGTAGCTA . 840 

CTTAATTTTC TAATTTTTTC TATTTTTTCT TTATCTTCAC TAGAAGTTTT ATTGCCCAAA 900 

ATATTTTCAA TTAAACTAAT TACAGACGCA ATATCACTAA ATTCCATATT TAAAGATTTA 9 60 

TCAAAAGATA ATGAATAAAG TTTAATTAAA GAAAATATTA TTCTTAAATT ATCTATATCT 1020 

TTACTTTCTT CATATTCTTT GTATATCTTT TTAGATTTTT CTATATCTTC TTTAGTAGTA 1080 

TCATTAATAC CTTTAATTTT TTGATAAATA TCTTCTAAAA TAGTTATAAT TTCTTTAATT 1140 

CTTTTTTTAA ACAAAGAAAA TCCACTTTCA AATTTCTTTT TTACAATATC AAAGAATTCA 12 00 

TCTTTGGTAT ATCCTAGCAG GGCATTTCCT, GCTTTTATAT GATGTTCAAT AAAGCTTAGT 1260 

GGTGTTCCAA AAATAAAAGT ATTAATCCAC AAACTTAGCA TAGTAATTTC AACTGAAATG 1320 

GGATTAATAT CAACACCATA AATACACTTC TTTAGTAACA TCCTTTTAAG TACTAATTCT 1380 

TTACTTATAC TATCTTGAAC ATCATACTCT TCACTTTCTT CAATAATAAC CCTATATTCT 1440 

TCATCAAGTT CTTTTTTTAC ATCTTCAAAT TTATCTAGCT CGTACCATAC CTTTTCTGTT 1500 

AAGTAATCTA GACAAGAAAT TAAAAAATGC CCTGATCCAC AAGAATTATC AATTATCTTT 1560 

ATATCTAAAG GGGATTTGGT TTTAAGCTGC TCTTCAATTG ATGATATGAC CATAAAATCA 1620 

GTCAAGTCAT CTGGAGTATA ATATGCCCCA CTTTTCTTTC TATCAAGTGA TCTAGATGTA 1680 
AGATAAATAT TACCTTTAAG ATATGTAGCA. ATTTTGTTTA CTTTCTTATT . TTCAAGCTCT ^ . 1740 

TCTTCAGTAC GAATAAGGTA AACTCCGTCT TCAATAATAC GATGAACAGT GGTATCTGCA 1800 

ATTCTTAGGT CATATTCAAG TAGAGTTTCG TATAATTCTC CAAAACTTTT AGGATCTAAC 1860 

CTTGAATACT TTACAAATTT TTCATCTTTA ATATTTTTTT CTTCAAAGAA AAGCATTTTA 1920 

ACTAGTATTT CTTCAATCTC GCTAATACTG AGCAAACCTT CATTATTTAA ATATTTAACC 1980 

TTATCTTCTG AAAATAACCC TCCATTAAAT ACAGGAAACT TTATTGCATC ACTTCCTTTA 2040 

TCAAGTAAAT TGAAAATTGT TATTATTTTT TTATATTCTA ATTTCTTTTT TGTATTTTCA 2100 

TCATAAAAAA AATATCTAAA AGATATAGAA GATCTGTATA GCTTATTTTC TTGTAATATT 2160 

TTCTTAAAAA TGTCGTTATC TOfcAATATAT GCAATAAAAA ATATTCTTAA AATAAAAATA 2220 

ATTGATTCTT CAAGAATGCT AGCTAAAATA TGCTGAGTAA TTTCTTTGCC TGATAATTTA 2280 
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AATTCTTTGT CATATATATT TTTTGCAATT TTAAATACTA TAGAGTCGTC^TOGTCTCTCA 2340 

TAAAGTATCT CTTTTAGAGT TTTTTGAATT ATCTCTTTTT CTTTAGCTAT TTGTTCTTTT 2400 

TCAACCTCTA TTACATTACT TGTCTTTAGA TATCTTTCTT TTCTTATAAG GTAGATGAAT 2460 

AAAACAAACC ATTCTTGTTC CTTATATTCT TCTTTTTCTT CAATTTTAGA AAAATTGAAT 2520 

TCAATATATC TTTTTTCTCC ATAAAGTACT TTCGATTTGT CATATAATCT CCATACCTTT 2 580 

CCATTTGAAA GTATCCCATA ATGTTTTTGA TATTGATTTA GATATCTATA TAGCTGATCT 2640 

TCTGATTCTT TTAATTTATC TTTAGCATCA AAACTAAATG TTGGGCGCTT AACCTCTGCT 2700 

ATAATCAAGA TATCTTCGAT AGGAATAGGT TCATTATTTT TTTTAGCTTC TTTTAATTTA 27 60 

TTATTAAAGG ATGCTTTGTC TTTGTCGTTT TCAAAAAGCA GTATATCTAC TCTAGACTCC 2820 

ACTCCTTCTA. TTTGACCGGC TTTTTGTTGT .TCTACTGAAT AATTTAGTTC TTCAAATATA 2880 

TACTTTAGCA AAGACTCTAT ATTTGCTTCT GTGGAATTAT CATCTATTGA AAAAAGTTTA 2940 

TTTTTTATAA GAATAAAAAA GTCTTTTAGC TTATTAATAT TTTCCTTTTT TATAAAGTCT 3000 

TTTGATAATT GTTTATAAAG AGATATATTA GGATTATTTG TTTTTACGAT ATCATTAGTT 3 060 

TTCATTATCT ATGCTTTTAA AAACCTTTTA TATTATTTAC AAATCTTTTC CATATATTAT 3120 

TAATATTAAC AATATATTTT AAAAAAATTA AGTTTTTAAT TAAAAACTTA ATTTTTAGAT 3180 

AAATAGGTTG ATAGAATAAC TTTCAATGAA TTCAACCACA ACAAAAATCA TATTCATTTA 3240 

TCACTAGAGT TTGCTCCCAA TATACACCTT CTAAATTTAT TAATAATCTA AAAAAAGTAT 3300 

CTTTAAGATT TATAAGAAAA AAATATTTTA CTTATTTAGA CAAGTATTAC CGGAAGCCTT 3360 

ATTTGGTCTA GAAATTATTG TCTTCTCTTT ACTAGAGATG ATTCTATTGA TATCATCAAA 3420 

AAGTATATTC AAAAACAAAA CAAATCTATT TATTGGCAAA TTCATATCCA CCAAAATTTC 3480 

ATAGAAATTA TAGATGGAAA ATTCTTTGTT ATTTTTTGGC AAATTATTTA ATAATATTAA 3540 

AATTATTTGA TTTTTATTAT TAAATTGTAA TATTATTATT TTGAATTAAA ATTATATTTA 3600 

TTAGTCTAAA TTTGTAAGGA GAATATTTTG AAAAACCCCA AATCAAATAA ATCTAAGCTT 3660 

AACATTATTA CAGCAATATT AGCTTCAATT TACATATCAT GTGCACCTAT TGGAAAGGTC 3720 

AATACAAAGC CAAATAGTGA TACCAATCCA GAAAATAACC AAAATTAGAA TTTAGAGAAG 37 80 

CTTTTCGTAT AAATTTTTTA TAATTTTCAG GATTATACTC ACTGGCAACT ATGTTCAATA 3840 

TTCCTCAAAT GGCTATAATA AAGGAATATT GAAATTATAG GCTATGTAAG CTGCCGATGC 3900 

ACTTTCCATA TCTATTATAA TTGTATTTTC AAATTCTTCA AAAATATTTT AGATATATTG 3960 

ATTTTCATAA TTAATAGATC AGTCTTCCAA CAATTATTAA CCCTAAATGT GATATTGTCC 4020 

TGCCTATCTT GATTTAGAAG CCTTTATTGC AAATGTTTAT TTGATATAAA TTTTTTAGAA 4080 
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TGTTCTGGAG CCTGTCCTAT TTAATACTTA GAGGAATTTA AAAAACATAT ACAAAGCTAA 4140 

AAATTATCTA AAAAGCAATT TTTCATACTA CATGTTCCAG ATGGTATAAA AATAAAAAAT 4200 

GATTTAAGGA ACTATAAAGT TTATCTTTTA AAGTTCCTTA AATCCACAAA AGCTTTGCTA 4260 

TAAGCTCTGA TATAAATTAT AGAATATGGG GAAGGAAGTA CCAATAGTTA AAATTATAGC 4320 

TTTTAAGTCA ACTAAAGGGG TTGAAGAAAA ATATAAAGTT AAAAGCCCAA AGTTAATTTC 4380 

TGAAGTATTG AATATTGATT TTTATCAATA TAAAATTAGT ATTGCTCTAA TTAGGTAAAG 4440 

GGGCTTCAAG AAAGCCCGGG CGCATTAATT CATATAATTT TTAGGGGTTT AAATGACTAT 4500 

TTAAAAAAGC ATTTGTTAAA TTTCTCTACA AGGAAAGCAA ATATAATTAT ATACTTGCGC 4560 

ATCTTACTAT ACAAGATAAA CAAAATAATA GGGATAAAAC CTATAAAATT GCATTGGGTC 4620 

TAAAATTATT TCATTATGGT TGTTAGCCCG GATGTTTAAA GTTTTTTGAG ATTTTTAAAT 4680 
ATCATTAAAA GCTTGGAATT TTTTGTAATG AGCTGTAATG ATATTTTTAC TAAAAAAGGG - 4740 

ACACTTTCTA ATCTAAAATT GAGTGCGGTT GAACGTTGTA TTTTAGATGA CATGGAAATA 4800 

GTGATAATGA ATTAAAAAAT AATTTATTTG AAAGTTATGA TGAAAAAACT TGGACGAGTT 4860 

TTTTATGAGC TTGGGATCTA ACCTTTTTTA TACAATTTTT TAGCTTGTAT TTGTAATATT 4920 

ACAACTTTTT AAACTCTTCT TACATAATTT CAATTTATTA ATTGAAATTA TGTTCATACA 4980 

TATTATATAA ATCTTAAAAG TTTCTAAATC TAATACTGAA TATTACGATT TATTTTTAGT 5040 

TATCATATAA TTTTAAAAAA AAAATATTAT ATTCAACCTT ATTAACTTCT TTATTTAAAA 5100 

TATCCGTATG GCCCAATAAC TATAAAATAG ACATTAAACG TATGTGCAAC ATGCCCTATT 5160 

ACGACACCTT CCATCTCAAT AACTATTACA TCTTTAAAGT TTTTTATAAT TTTGTTCATA 5220 

TATTTTAGAT CAATAAACTG ATCTCCTCAA ACTATTAATCjCCAAATATGC ATTAAAATCT 5280 

ATAATTTTTG ATTTAACAAC CTCTATAGCT TTACTAGCCC AATATTAAAA ACATATACAA 5340 

AAATTCAAAT TTTTACCACT TTTTTTAAAT TTCTTGCAAA AATATTGAAA AAGGGATTTG 5400 

ATCGTATTAA CTGCATTAAT AAAAACCCTA AATACATTAA ATTTAAAATT TTATTTGCCC 5460 

GCGCTATAAA ACAAAATTTG ATAAGCATAA AAATACCTTT GCTTCTTTTT CTAAATACTC 5520 

TTTCACTCTT TTTAAGCCTT TATCATTTGC ATAATTGTTG CAAGAACTTA TCAACACAAA 5580 

AATAATAAAA CAATAAACAT TTTTTTGCAT ATTGCTCTAT AGAGTAAAAC AAAATACAAT 5640 

ACTATATAAA TTATATTTAC AATATTTTCT ACAAATTCTA AAAAGTTAAC AGGTCAATTG 5700 

ATATTGATCC ACAGAATTTC TTGTCTTTTG CTTAATTCTT TTTGTGATAT AATGAAAAAA 5760 

TATTTTATAA ATTCTTGACT TTGATCAAGG TAATAGGAGA AATTTTATGC AAAAAGACAT 5820 
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t^Ktatatacc attattttat tcgtgttttt^tcai 



ATATATTTCG AATATATTTT TATATATACC ATTATTTTAT TCGTGTTTTT TGACGCCACC 5880 

AAAATCTTTA AAAATCAACA GTATCAAAAC TGAAGTTTTT GATTTTAAGA TAATTGAAGA 5940 

GGGGGATATT ACAAAATATA ATAAAAACCC CATTAAAGAG AGTAACAATA ATATTTGTCT 6000 

TACTTTTAAG GAACCCGAAT TAAATGAAAT AAAAGAAGGA GAGGTGTTTG AAATACTTGC 6060 

AArTGGTTAT GTTACATGGG CAAAATCTGG TGATTTAArA GATATAAAAG ATAAAiy^TAA 6120 

yAATTTAATT GAArATCTTA GAGAGCTTAA GTATTCTTAT ATTTTTTCAC CCATCCGATT 6180 

CAAAACTTAT TCATTGCTTA CCTTTAGCTA TACTTAATTA TAGCATTAAT GACAATAACT 6240 

ATAAAATATT CGGTCAAGAA GTACCTATAG CTAAGATAAT AGCATTTGAA TCAACTGAAG 6300 

AGTTTGAAAA CAAATATGAA ATCAAAAGTT TAAAACTAAA TTCTGAAGAG TCGAATATTG 6360 

ATTTTGAACA AAATAGAACT GGTTTTGCCA AAATCAATTT AAAAGAAACT TCAAGGGAAC 6420 

CTCAATACAT^TTATTCATAT AATTTTGGGG TTTTTGACAA TTCCTTAGTA GATTATTTTA 6480 

AGCTCTTTTA CAAGAAAAGT AAATGCAACT ATATGCCTGC ATATCTTACT ATAAAAGATA 6540 

AACAAACAAA TAAAGATAAA ACCTACGAAA TCATATTAAA TCTAAAGCTA TTTAATAATA 6600 

CTATTAGATT AATATTTAAT AAGTATTCAA ATTTATCAAA AGAAAAATTA AAACTTTTTA 6660 

CTGATGAATG ATAAAAATTG AATAAGAAAA GCAAAGACAA AAATTTATCA ATTAATGTAA 6720 

ATAAATACAA TTCAAAATTG ATAAAGTTGT GTC5ACATATT CGGCATCTCA ACTTGTCGAT 6780 

TTAAAAGTAT TGATAATAAA AACCAATTTT AGCCCTTTTT CAAAGATGTT ATTTAATTAA 6840 

TCGGTTTTAC TTATTAAGGC TAATATTAAA TATTTAGAAT ATTTAAATTT TCAAGACCGC 6900 

AAGTATCAAA TATTTATTTC TCAATGGACC GGATTATATT ATTATTAAAA TAATTAAACT 6960 

TGTTAAAAAT CAATCAAGGA TATATAAAAC AGATTTTTTA AAATATTATA TU^CTTTTGA 7020 

TAATAAAAGT ATCCTTGTAT TATATATAAT AATATTTTTA ATTAAATAGA TAAAATATAT 7080 

TATTGATATT GAATTTGATT AAATAATTAA GCATACTAAA TACAGAGCCA TTCAAGGAGA 7140 
GTATTTATGA AATACTATAT ATGTGTGTGT GTTTTTTTGC TTTTGAATGC TTGCAATTCA . 7200 

GATTTTAGCA CTAATCAAGA AGATATTAAA TATCCATCTG ATAAAGAGAA ATCAAAATCC 7260 

AACATGGAAG CAAGCTCTAA AGAAGAAGAT CCAAATAAAA AAATAAAAAA TACACTGCTT 7320 

AATGATTTAA TAAATTTGAT AGAAATAGCT AATGAGCATA AAGAAAAATA TGAAAAAAGA 7380 

ATGCAAGAAG AACCTTCAGA TCAATACGGA ATATTGGCTT TCCAGGAATT AGACTTGTCC 7440 

GTTGGAAAAA TATCTGAAGA CACCCCGCAA TCTAAAAAAT TTAGAAAAAA CACCTATTCT 7500 

CCCTTAAGCG CTATTGATGT CAATAAATTA AAAGATCTTT CAGAGATTAT AAGAAATTCG 7560 

GGCCAAATAC AAGGTTTATT TAATATTTTC AACAGATTCG GAGGCATTTT TGACGACTCA 7620 
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CTTAATCACG TATATTCTAA AAAAGATATC CTAGGGGGAC TAGAAATTTT GGATTTAGAT 7680 

AAACTAAAAA ATTCGTTTGA AAAATTACTA TCTATAAAAG AAACTTTCTC AAAAATGCTA 7740 

AATCAACTTT TATTAGATTA TAAAAATGAT AAAGATCATA TACGAACAGA GACAAATAAA 7800 

CTTAAATCTC ATACAACTGC ACTTTTCGAA CAACTTGATA AAAAAGAAGA CGAAGCATAT 7860 

GAACCTAAAA ATCA(3ATATT TTCAATAAGT AACCTTTAAA AAAAGATTCA ACTCCATATA * 7920 

TAAAATTTAA AAATTGTGCT AACATTCATT TATAAAAACT TAATTATTAG GAGGTAATAT 7980 

TAATATGAAA AAATTTTCAC ATTAATATTA ATTTTTAGTT TAACAATGCA AATCTTTGCA 8040 

CAAGAGAAAC TTGAAAAAGG TGTTGGAGAT ATTGCAACCG TAATGAAATA TGAAAGTAAA 8100 

AAAGCAACCA TATTAGCACC ATTACTTTTG AACATCTTTT TATCTTTAGG AATAGGATCC 8160 

TTTGTTCAAG GAGATTATAT TGGTGGTGGT GCACTACTTG GCTCTCAAGT GCTTGGAGGA 8220 

ATACTTATAA TGGCTGGATA CATGACCGGG .GATATTGGAT TCGTTACAGA AAGCACAGCA 8280 

ACAGTAATAA CCGGAGGAGT ATTATCAGGA ATAGGAGGGC TCACAATTGC AGCATCCTAC 8340 

ATCACTGGAA TTATCATTCC ATTTAAATTT GCTAATAGAT ACAACGCAGA CCTTAAAAAA 8400 

AGACTCGGCA TTGCACTTGC GGGGCTTGAA CCCAATTTTG ACATTGGAAT AAACGGGGAT 8460 

TCCAACTATC GTTTAAAAAA TCCTATTGAA TATCAATTTA CCTGGGGTTA AGAGAGATTA 8520 

TTAATGCAAA TAATCTCTCT TCAAAGCCTA CTAAAAAAAT TCATTGATAC TATTTCGAAA 8580 

TCAAGAATTA CATAAATAAC TTTTTGTCTC AATTCACAAA AGTTTTTTAA ATTTCACAAG 8640 

ATTTACCTAA ACTAAAGTAG TAATAAAAAT GAAAAAAGTC CCCCCC7U\AA GGGACGCTTT 8700 

GATTGCGACG ATAATTGTGG AAGGACAAAC GACATCATCC AGCCTAAAAT AACAATAGCA 87 60 
.CGATATATaA^TAAAAATCAA. .GTATTTGTTT TTATTCTTTT TTTTTCTTTT. ATATTT.TTCA. ... . 8820 

TATTCATTAA TTAGATCTGA TAAGACTTCT TTTTTAGTAA AAAAAAGTCT TTCAAGAATA 8880 

TAACACGCTC TTTTAGTATC TTCTTTACAA AACGTATi\AA ACTCTTTATT CTTCATAAAA 8940 

AACCTGATAG ACATTTTTTT ATTATTTACT TCGGACAAAT TTTCTTTTTT TACGTTTAAT 9000 

AAATTCTCTT TCAATTGTCT TTGCAAGCCT CTAAATCCTG TTTCTTTAAT ATTATCTATA 9060 

GAGATAGCTC CTTCTAAAAC CTTTTCATAA ACTTTTAAAT ACAAATACGC TTGTGTTTTT 9120 

GCAATTACAA AATGTTTTAT AAATTGCTCA AAACTAGAAA AATTATCATA TTTGTAAAGT 9180 

TCTTTTTTTT TAATTTCGTA TAAAATTTTC ATTCTTTCAA TTTTATTATC AATATCATCT 9240 

TTTAAATTAT ATTTTAATTT CTCCTTTAAA TTATTGTAAT TAATCAAATC CTTATCTTGC 9300 

ATGTTATCTA TATTTGTCAA CTCTTTATTC ATATGACTGA AAGTCCTACT ATTTAAGACT 9360 
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AGCTCTTTTT TGTTGTATTT 




1^ 931 
TCCCCATC TTATCATCC 



9399 



(2) INFORMATION FOR SEQ ID NO: 15: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9360 base pairs 
. (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear , 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15: 

GGGGTACAAC AGAACGTAGA AGTTGAGGCT GGTGGTGGGG ATGACTTGTA CGGAATATGC 60 

ACTGATATAG ATGAGTTTAC TGGCATGGCA ACTGTAGTTC CAATTACAAA TAACTTCACA 120 

GGGTATTTAA CATTTAAGAA AAATGGACAA AATGGTGTGA ATCCGGGTGA TAAGCTGCAT 180 

TTTAATGCAC AAGGAGAGCT TGAAAAGAAT GGGGGAAATG ATAAATCTGT TAATGCTATA 240 

GCACTTTCAA AAGTACATAA ATTAACTGAA GAGTTATCTA TAGTGCTTGC TAGTGTTTTT 300 

GGGAATAGAG CTTTAAAAGG TAATTAAATT ATGGCTTTAA AAGGCAAAGG GCAAGCTAAA 3 60 

TCTCCTAATG TTGATGATAA TCCACAATTA GGGTTAGAAT CAGAAATTCC AGCTGcTCCT 420 

AGATCTAAAC GTCAAACAAG ACAGGCTGAA GAAGTACAAG CAAAAGATCC TTATTTAGAT 480 

TCAGTTAAAG AACTTGACGA TGTTCTTTTA AAATTTAAAA AATATTCAAA ATCAATGAGT 540 

TCGATTGAAA ATAGGGTTTT TAGTAGTTCG GGTGGTTGTT TTAAATTAAA GAATGAGCGA 600 

GTTAATGCTT ATTCTTTTAC ATGTTCAAGC TTTGCAGACA AAATAGAAGA ATACCTTTAT 660 

GATCCAGCAA ATAGTTTTCC ATATAAGCGT GGGGTTAAAC TTGTTCCAAA AGAGAACTCT . 720 

ATATATGTTG AAGTTGGTGC TGATACTGaT ATGTATGGGA TATGTGTAGA TGTATGTGAG 780 

TTTAGTAGTA CTGCGTATGT ATTACCAATT ACGAATAACT TTGAAGGGTA TCTTGTTACA 840 

AGAAATCCGA GTATAAAAAT GGGAGAAATA TTGGATAAAA GTGCATTTTT TAGAGTTTTT 900 

TCTGGAGATT GTGTACATGC TACGATTTTT TTTATCTTTT CAAAAAGAGA ATTTCTTGAA 960 

TTCTTATTAT TATTTTTTAT TAATTTTTTA TTATATACAG TGACATTTTT AGACTTTAAT 1020 

TTTTCTTTAT TTGATTTTAT TTTTTTGGAT AACTCAAGCT TGATACTAGA AAAATAAGTA 10 80 

TCAATTATTG AGTATGAAAT TCTAGAAGTT TGGTATATAC AAAGCTTGCC TTTAAATTGT 1140 

CCTATGTTAT TTGAAAATGT TAGAATTTTT TTATTAATTG CTTTAATTTT AATTAAAAAT 1200 

CTTAAATCTT CTCGTAATGT ACGAATTGTA GTTGGCTTAT ACCCTTCTTT GATTATAAAT 1260 

GAATTTAGTA TATTTAATAT GTCTTGTTGG TGGTGTATAA GAATACAAAG TGCAGTATTT 1320 

GTAATATCTT CTTTATGAAG ATTAATATTA CAATTTTCTT CGAACTTTTT ATTTAGAAAA 1380 
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TTTATTATGC TGATTATTTT TTTAAGCCTA AGGTTTTTTG ATAATAACCT TTTAGTTTTA 1440 

TAACAATAAT TATTGTTATA GAGATATAAC TGATATCATA TTGAATCTCC AATTTATCGT 1500 

TTATTCAAAC TTTTTTATTA. ATCCTTATTA ATAAAACTAT TATAGTTTAA ATGGTGCATA 1560 

ATTTTCAACA TTTTGGCTCG AAGATTTTTT AAAAAAGTGT TGTGATTTTC CTAGTAGAGT 1620 

AAAAGACCAT TAGCTTTTGC TAATGGTCTT TTACAAGGTA TTGATAGTTC ATAATTTATT 1680 

ATGTAACTAT CAATACAAAT GTTATATGCT AAAAAATATA AAATATCAAG AAATATGAAA 1740 

AAAATTTTCA TATTTCTCTA TTCTGCCATT CTAAATGTCA TTAAATGTTC TTTTGATTTT 1800 

AGCATTCTAA CTAATTTTTC AGCATCAAGC ACATCTCCAT AAAAGTTGTA GTAAAAATTA 1860 

TTTACAACTG TACTGCTTTG GGTCTTTTGT AATTTAGTAA TTTCTTCTGA AATAATTTTA 1920 

GCTTCAAGTT TGCATAAATT TGCATCTATT GGTGCAGGAG TTATTCTTAC CAATTCGGGT 1980 

TGCCCAAAGT CACTAGACAT TACACCTAAG TTTGGTATAT ATGTCGGTTT ATTTGAAACA 2040 

AATCGTTCAC AACCATGAGC AAGTGTTATC TCTTCAATAG ATCCAGCTGA TTTTACTGTT ' 2100 

GCAATTCTTT TTAGTATTTC GTCTAAAATT TTTTGCATCT TTCTTAACCT ATCGGCCTTG 2160 

CCCAAATTCC ACCAATTTTC ATCATTTACC TTATCAACTT CGGCCTGTGC TTTTATTCGT 2220 

TCGGGCTCTG GTTTAGAAAG TTTGTTTTTG CGTTCTACTT CTAGGTTTTT AGTCTCTTCG 2280 

GTCTTAGTAA GTTGGGTGGT TTCTATATCT TTTTTTGTTT TATATTGTGT TTGTACATCG 2340 

TGTAATCTTT TTTGAAATTA TTCACCAGAT ATTTGTCCTT TACTTTGAGC CTGTTTGAGA 2400 

AATTTTATTT CTTTAGTGTA TACATCATCT AATTCGCTCA ATTTTTCTTT TTTCATTTTG 2460 

ATTTCTGCAT CAAAACGATC TTCAAGCTTT TGAAGTTAAA CTTCACTTAG TTTTTTAAGT 2520 

TCGTCCAAAT CTTAGTCCCG TTTTT.TTCAA CTGCTTTAAT TCTCGCTTTT T?GA.TGCCCTT - 2580 

TGAAAATTCC CCAAATAAAA TCGGTCAATG CTGTTATAAG TTCTGCAACA GCTTCTCCCC 2640 

AAGGTCCAAG AATTTTTTCA GCGGCTTTTA ACCCACTTTT CCAAGTTTCG TACATTTGTT 2700 

TTGACATTTT TTCCAAAACT TCACCCCAAT GCCCATCATG AATTGCTTCT CCAATACTTT 2760 

CTCCCATATC CTGATTCAAA AAATTACAGC TGACCGATAG ATCTTTCATA AAGGCCTTTA 2820 

GGCgTCTAAC ATGCGGTCAT ATAAGCTTTT TGACGTATCT TTAGCTTTCT CAGCCATTTG 2880 

TTTTAGAGAG TTTCTGATGG TTTCATTTAG CTTTTCGAAT TGCGATTTGT GCTCATTCAC 2940 

GAATTTTTTG TACATTAATT GAATGTCGGA TGCCATCTTT TCTTCAGCAC TTGCTCTTTC 30.00 

TTTTGCTGGA AGTAACATTG TTTTCTACTC TAAGTCGGTT ATTTCTTTTT TGCAGAGCTT 3060 

TTTGAGCCTC GACAAAAGAT CGATCTAAAG AGGTTTTTTC AAATTCCTTA ACCTGATTTT 3120 
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SC^TGTTAGACT CGTTCAGAGT TTCGAAACTT^TTCC 



CAAGTGCGAT TACAACTTGCTTrGTTAGACT CGTTCAGAGT TTCGAAACTT^TTCCATATT 3180 

TTTCTACGAA CGCTTTGTTC TTTTCATTGA TTTCATCATT CAGTTTCTGT AAAGCACTTT 3240 

CTTCATCTAT ATGGGGTAGG GTTAATCGTA TTTTTCTTTC ACGACTTTCT TTTTCTTTTA 3300 

GATAGATACT AGTCTATTTT TATCTAGATT TACCCCCCCA AAAAAAGCAA ATTTACTTTT 3360 

GTATTTTTGT GCTTTTGTAT TGTTAATAAT TTGACCTGTA CATCGATTTC TTTTATTTAC 3420- 

CATTTGCTTG TACGCTGTAA GTTCTTGTAC TAGAAAACTG ATATTGTCTA TTTGCGAATC * .3480 

AAGGTCTCCT TCCTAGTCAA TTTTGAACTT AATGTTGTAC TTTTTTTCAT TGCATCCAAA 3540 

AATGCAAGCT TAGCGTCTTT TACACTCAGA ATATTTGCAA AAGGTGGAGC AATTTCATAC 3600 

TGCTCACAAG CTTTCTCAAA ATTTGACAAA ATTTTGGAAT CTTTGAAAGC ATTAACCTCG 3 660 

GTTTGCCTTT CGGCTTGTTT TCAAGCTTTC GTAAAGTTAC TCTCAGCCTC AGCAAGTCGT 3720 

TTTTCAAAAT CTTCTCGTGA TATCATGTCT GGCAATTTTT TTCATCAGCC ACTAACCGTT 3780 

CATATTCTTC TGAAGATATT GTTACAAGTT CTTTGTCATT TTTTGGCAAA GATTCAGGAA 3840 

TTGTAACAGT TTCTTCATTT ATTTGTTCTT GCATATTGCC CTCCTTAAAA TTAAATTTTC 3900 

TAAATTTGCA AGTACTGATT CATTTCATCT TGTATTTTTA AATACAAACT ATCATTTCCC 3960 

ATTTCTTTTG CTTTACTTAA AAGCTCCACA TAAGTTGCTA AGGTTTTTGC ATGTTTTTCA 4020 

TCAATTTTGG CTTGTTCTTT TTGACTAATT GGTTTTACTG GTTTGTAACA CCAATTAGAG 4080 

CTCAATCCAA ATTTTGAAAG TACCGCATTA ATGAATGGCG GTACCATTAG TTTGCATATC 4140 

TGTTAAATGT TTAGATATGA TAAATAAATC AAGTGATAAA TATATGTTTT TCTTTGCCAA 4200 

TAAAGTATTA GACGCGCTTA AAATAGAACG AATGAAAGTA TCTATAAAGA CAATAGAATG 4260 

TATTTTCTAG AACCTTCACA AAGTATTAAT CTTATAGAAA AGAAAGAAAG TACAAAAAAA 4320 

GAAAATAGAA TTATAATATC ACTTGGCGTG TAGTGATATT ATAATTCTAT TTATATTTAT 4380 

TCATTAAATT CTTTAAGATT TTGTATTATT TCGTCAATTT CTTTTTGTAC ATTAATTGTA 4440 

TAGCTAAGCA CTTTTATAAC TTTCTCAAGA TGTTCAATTT CGTCTTCATT TTCATTAATA 4500 

ATAAGTTCTT TCCCTTTTCT GTACTTTAAG TAACTTTTAA GCACTTGATA ACTTCCAATT 4560 

TTGTATTCAT ATACTTCTTT AGCTACATTA GTAAAACAAC ATGTTGAATT ATAGTA7UVGT 4620 

TCTTTTGTGT CTTCTTTATA AGTAATTTTC TCTACAATAC GATTATAGTC TCCAGTGTGA 4680 

TTACCAATAC TATTGTTGAG CTTTAAATTA TCTTTTAATA AATGAGAATT AATGAGTi^A 4740 

GTTCCAAGCT TACTAAGCTC TAAAAATGCA TCTACATTAT TTACAAAAAT AATCWPAGGA 4800 

TAGTCTATTT TTAAAAATTC GTAGAATTTT TCTCTATAAG TATTTGAGTA TAGCACTGCA 4860 

TAGATATAAC CAAATATTTC TTCTGGAGTA AATATTTTAC TGTATTTAGT ATTAATAAAT 4920 
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TCTCTAAAAA TATCTTTATT GTCCTTTTCA TCCTTCTTAA 
TTAAATACAC CTTGATTTTC TTTTATATAA AGTGGAAAAA 
TTATTTGAAA CAAAACATTT ATCCGAAATT TCAGAAGTAA 
TTTGTTGATA AAAGCCTTGT TGTAACAAGT CCTATATTGC 
TTCATTGTTT TATATCTTGG CTCTACTACA ACCCCTTTAT 
CTATTATCAA ATGGTCTATA TGATATTTCT TTAACATAAC 
TTTAAAAATT TTTGAATTTC TGATAACTTC CAAAACATAG 
TTGTTCCTTG CATCTTGTTC TGGTAAATAT GCAAAATCCC 
TCTTTTGTAT AATCAATCGC TATTTTGTCT TTTCTAGTTA 
TTAAAAATAT CTATTAAAGA TTTTCCTTTA TTATAAATAT 
TTAAGAAAAA AATAATTAGG CTCTTTATAG TCAAGTTTTT 
TGATTTTTAT TTAAAAAATC ATATTTATGA TCTCTTTTTC 
ACATTAGCCA GTTCATTCTT TTTTTCTTTT TCTTTATATT 
ACCCCAGTTT GAATGTCAAA TACATTTTCA TCTATACTAC 
TTACGCGAAC TACCATGTAG ATTAAGGATG TAGATTTCAT 
TGTCTCATGC CTCTGAATGT GATGTTATCA AGGTATCCAT 
AGTCCTTCTT CACTGCCTTT AATAGTTAAC AATCCTTCTT 
TTCTCTGCAA ATCTAATAAA CTTAACATAA TCATCATTAA 
TTTATAGGAC TATTTTTTAT TTTTTTATAA TCATTAACTA 
TTATTTCTTG , ACTaTGaA^CT ATAAQGAGGA^ T.TTCC AAGTA 
TTAATTTCAT TTGGCTTCTT TCGTCTCTTT TGCAATATCT 
GAATTTCTGA TCTGTAATTT CTTTTAAGTC AAGAGTGTTA 
TGAATCCTTA TTAAAGTCAA CTTTGCAAAC TTCTTTTAAA 
TGTTACAGCA TAAGGTGCCA TTAAATATTC . AAAACCATAT 
ATTAATATAG TCTTTTTGTC TACCAGATTC CTCTGGGATT 
AATAACTTGA AGTAAAAATG TACCTGTTCC TGTTGCAAAG 
TTTATTTGCA AGGCCATGAT TTAACTTAAA TTCTTTTTTA 
AACAATAAAA CTAACAATAG GGCTAGGGGT GTAGTAAACT 
TACATCGTAT TTAGCAAGAA AATCTTCATA AAAATAAAGA 
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AGTTTTCTTT TTTTATATTT 4980 

GATAGCATGA TTCACTACCT 5040 

CCAAAGCATG TTTAAAACTA 5100 

CTTCAATTTC TAAAATATGT 5160 

TTTTAGAATA ATAAGTAAAT . 5220 

TTTTATTAAA ATTGGTATTT 5.280 

AATCTTTTTC TATATCATAT 5340 

TAAGTTTATC CATAAGGTTA 5400 

CTATTCCAAC ATTAAATTCA 5460 

CTTCATTTGA TAAATCTTTT 5520 

CAAAATTAAG ATCATAAATA 5580 

CTTTTATACT GCTGTAGTAT 5640 

TAGCAAAAAT AGCAATTGCA 5700 

CATCGTCAGT TTTTTCTTTT 5760 

CAAAAGTGCT TAGCAAATGA 5820 

TGTTTGTTAT AATTCCAAGA 5880 

TTTTATTCCT CTCTAATTTA 5940 

GTGTTTTAGT ATTTCTTTCA 6000 

AATTCAATAT ATATTGATTA 6060 
TTACTAGTAT TGGATTACGT _ . . 6 1 2 0 

TTAAAAAAAG AAAAAGAAAA 6180 

GTTAAGTACA CTTTGAGCTT 6240 

TACTGACTTA ATTTAAGGTG 6300 

AAGTTTTTAA GTATATGTAG 6360 

TCCTTTAGTA TTATAGTACG 6420 

TCCAGTACTG TAACTTTTTC 6480 

AGCATTTCAT TTAAACTACT 6540 

CCTTTTC3CCT TCCTTAAGGA 6600 

TAGGGATCCT TTAAATTTAA 6660 
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GCTAGAATTA GTAAATGAAA STTCATTAAA AATAAGTTTT GTATCAATAT^R^TTTACTAT 6720 

GCTTATAATA CTTTCTAAAA TCCATCTTAA GTAATTAAAT TCACTATCTT TATGGATATC 6780 

TTTAATTAGT TTTATAATGT TTTGTATAAG TGAAAAATTA GTAGGTATAA AGTTTTCAAT 6840 

ATTTTTAAAA TTAATTTCTA TATTTTCTTT ACTATTAAGA CGAGCAATAA AAAGTCCATA 6900 

TGTAATAGTT TGAGCGATTG AATCTGAAAA TTCTGAAATA TTAAAATCAT CGCTATAAAT 6960 

ACTTTTTTTA AGTATTCTAC AAGTTGAAAC TAAAACATTT AGCTCACCTA GTTCTGATTC 7020 

ATCAATATCT AAATTTAGTT TTTCTTTATT TTCCTTTAAG TTTACTTCAA TCTCTTCTTT 7080 

TAAAGATTTA GTTTTACTTG CAAGTAGGCT AGCTAAAGCT TCAATACTTT TTATTTTTTC 7140 

AAAATGAGAG TTAAAGAACT CAAATAAAAT ATTTATAATT TTGGTTAATT TATTTTTATC 72 00 

GAGTTTGGTA TCTTCACTAT ATAGCTCTTC TTTAGTTAGT AAAGACCCTC TTAGTTTAAT 7260 

CTCTTTGTCT TTAATCCATA TAAACTCAAT ATAATTTGTA AGAAGTATAC TGCGTGTTAT 7320 

ATTTTTGTAT TTTTCAATTT GGGAACTTTT TAGTATTTCG TCTAAGTTTT GCTCAACTTT 7380 

TTTAACTTCA ATACACCCTA TAGTACCCTG GGTTATATTA TGTCTAACAA TATAGTCGGG 7440 

TGATCCAAAT CCTTCTTTGC TTCGTCTTGG CTCATGCTGA ATAGCAATGC TTGAATTTTG 7500 

ATTAATTTTA TTAAAATCAT TAAGTAAATT TTCTAAATGA GTTCTGTTAG AATACTCTGT 7560 

TTTTTCTTCT AATTTTGTAC TTTTTAGATT AGCTATATAT TCTTTTGCCT TTTTAAATAG 7620 

AGATTCATTA TTATTCATTT TTATAAATAT AAAAGATATA TAGTTTAATA TCAACTAAAC 7680 

TATATATTTG AAAAAACTAT TTTTGTTCTT AGCATATAAC AAAAATAAAA CTTTCTAAGT 7740 

TTCGATATAT TGCTTTCATG TCAGAATTTA ATTTTTCAAA TGTTTTTAAA TTTTCAGTTT 7800 

TAATATTATT GCTATTGCTA CTATTTATAG TAAATTCTTT ATTATTTTTT TATTGTCTAA 7860 

TAACACGATT TTTTCATTAA ACATACTAAA AGAGTTTTTA ATAATATTCT TAAATATTTC 7920 

ATCTGAATTT TTCGTATCAA AGTTAATTTT AGTTTTAAAA AATTTAAGAA ACTCATCGCT 7980 

TGTATTCTTA ATCTCTTTTT TAAATAAACt AAAAATTTGT CTGTATATTT TTTCTCTAAT 8040 

GTAAAAGATC TAGCTTCTTC AATATTTAAA GAATTTCTAG AAAATTTTTT AAGATATTCA 8100 

AAATCTTCAG ATGTTAATTT CTCTAAATTA ATAATCATAA AAGGCTCATT GTCTAGTGAA 8160 

TTATCTTTAT CCAAATGGCA TAGAATATAG ATTCTATGCC ATTTGGTAAT ATGCCCAATT 8220 

TAATTGCATA TTTAGAAAGA AGATTATAAA AATAATCTGA TAATTGACTA AAATGATTTT 8280 

CAAGATTTTC TTTATGATGC TTAACTTCTA AAAAATAGTA GGATTTTTAT CCTTAG7UVTA 8340 

AAGAACATAG ATCGCTTTTA TTTCATTTTT TCTAGTAACA ATAATTGAAA CTTCAACTTA 8400 

AACACATGAA GGATTAGTAT GACAATAACT CATTGCATCT AAAAATGGGT CAATAAAAAA 8460 
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CGGTCTTTTT TTTAGCTTCT ATTTTAAGAC CATCCTTATG AGTTTGTATT TTTTTACTTA 8520 

CAATACATTG ATATAAAAAT TTACCTAATT TCATTATTAA TATATTTAGT AGCGTTTTTA 8580 

ATTACAATTT TTTATATACC TAATGATAAA AATACAGATC ATAATCATAG TAAAGAAGAT 8640 

TTAAGTTTAT ATATTATGAA GTTTAAAAAA ATTGTAACAA CATTATTACA ATCTAAAGAA 8700 

CTTTTAGAAT TATTTATTTT AATTGGCTTT ATTCAATTTT TTTATCAACC TTTTTATTTA 8760 

AATTGGCAAG CAATTTTTAT TGACAAAACC ATATCTATTA GTATATTTGG AATTATCTAT 8820 

GTGCTATTTA GTTTATCAGA TATTGTGGGG GCATGGGTAT TTAGAAGAAT TAAACATACA 8880 

AAATATGATA TTTATATCAT ATTAACCATA ATATTGTTGT TATAAGCTTT AATAAAAATA 8940 

GTTTCACATA TTTATATATT TATTGCTGTA ATCACATTTT TAGTAATTTT AATTGCTATT 9000 

TATTCTAACA ATTTAGAATA TTTTTTAAGG. AAAAATATAG ATTCAAAGGT TTTAGGAACC 9060 

ATAACTTCTA TTAATAGTGT AATATCCCGC ATATTTTCAT TTTTAGCATT GGCTATATGT 9120 

TTGAATTTAA CTAATTTTAT AAGCGCTATA AATACATTTG TTTTATTAAT ACTTATTTTT 9180 

TGTACATTAT CTATTATTGT GGTGATTGCG CAAACTATAA TTTAATTTTT AAAAATATTT 9240 

AACCTATAGC TTAATATGAC GTTAGATGGA TTTAATTTAA TTAAATTCGA GTTAAATGTG 9300 

CTTTTTATTA TCCCCGTGAA AACCCTTTCA GCAGAAATAA TACAAGAATT TTTAAGCCAG 9360 



(2) INFORMATION FOR SEQ ID NO: 16: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8905 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double • 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16: 

AGTCTGAnGT GGGCCCTTnA ATATAAATAA AAAGGTTGAT AAAAAAATCG AATAGCGTCC 60 

ATTAAAATAA ATAATTCTAA AAGTTCTTTA GATTTTACTA ATATTTTTTT AAACTTTATG 12 0 

GGATATAAAG TTAAATTTTA TTTATTATGC TTATGATCTA TATTCTTATC ATTTGGTATG 180 

AAAAAATTGT AATTAAAGAG GATATTAAAT ATTAAATATT AAAATATATT AATAATAAAA 240 

TTAAGTAAAT TTTTATATCA ATGGTAGTAT TTTACAATTT ATTTTTGAAT TTCATTCAAT 300 

ATGGGCTACT AAAAATACTC GAGACAGCAT AATCTTAAAT AAAAAGAATA CGGCTTCTAA 360 

AAGAAAAGT6 AAAAGTAAAA GAAGTTCTAA AGAGAAAAAT CAAAATTATT TATACACTAA 42^ 

ATAAATAGTT CAAGGTTTAG AAGAATCTTT AAATAATAAT AAGTCAAATG GT^CTAATAG 480 
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TGGATCGGGC TCTGCGTTGC TTCAAAATTT AAAAAAAGTA ACAAAAAGGT TCTATATAGA 540 

TAGTTGAAAA ATCACAAAGT TTGTTGCATA TAAATCATGC AAATGAAGCA TTTAAGGAGA 600 

TCAGTTCTGC AAAAGATAAA ATTGACAGTT CCGATATAGG TAAAGGAATT GTTGATGTTC 660 

aaaaaacxx:a TAATAGATTA CATGATTTAT TGCGAGACAT AAAGACTGAA TTTTATAGCC 720 

aaaagaattc atttttaaat ggtgttagag ctgagaaaag taagaaaaag aatcaaatac 780 

tatttagatc tacttcctct ataaatggaa aaattagaaa tgcaaattat atactttaac: . 840 

atcctcttta aaaattttct aacttggttg tagaagccgt gcaattgcta tttgagagca 900 

taccattttg atttttaata gcaactcact aatgatttat agtgctttat ttattgtatt 960 

caattcaaaa aaatactaga tcaccgggtt ttggtgctgg gaatatggaa gaaagcagaa 1020 

aattatgttg acaagtttga tgaacttata attgtcaaga ataaagaatt atttgttatt 1080 

taaattgaaa gatatgattc taatagaaaa tattatcctt taattagatt tgcaaattta 1140 

attgaatttg aaatttttaa aatttaattg cagaaaaact ' ttttactgac aatcaagttt 1200 

taaacaattt caacaaacaa gcaagctttg attaagcccg tttgtaacaa aacatctgaa 12 60 

tttttaaaca gcaatgcact aagtgagagt tcttttttta ttgaattata tctgttaatt 1320 

taaagcccgt ttattggttt tgatatgtag aagctttgag aagcttgt^t aatttgtttg 1380 

atgtgaaata tatttttata ataaaaaatc cagctattat aaacaaagat tattaaactt 1440 

taatttacat taaagggaaa gaacaatact attttataat ttttcttttt agagaatttt 1500 

ttaattaaaa. aagttaatta tacatacata tttatataaa tatgtattga ttctaattta 1560 

attatatttt aattatctct tgagttaatt aaaatataat gacaataata tacttaaaaa 1620 

gtttgcaggt ttaatgttag gtgttgtcaa gggtatcttt gttgcatctt aaatctctag 1680 

ataaatgttt tttctctatg taatataacc tttctcctaa atgtcgtatc tataaaaaca 1740 

taagccccag gtgtttttaa gtttttgtaa cttatgtatc acaaaaaata tacataatat 1800 

tggttcattg cggcgtgttt atactaattt tgtttatgat tatgcatttt ggttgtcaaa 1860 

aatagctgaa gattattttc cagatgcaaa ggatatagta tgtataagag gtattaagaa 1920 

AAAGCCTTAT ATATAACAGT CCTACTGCAG GGTATAACGA TCATTACTAT GCCTGGATAA 1980 

ATAATGTTAA AGTCGTAATA AAGCGGGCTA AAAATATGCT TAAGATGTTA AGCATAAACA 2040 

AAAAATACTT AACGACAAGA TAGATCAAGC AAAATTAGAC TTTGATAAAT TAAAAAGGAT 2100 

ATATGATACT TTTAAAATTT TAGACCCTAG ACCCTAGACC CTAGACCCTA GACCCTAGAC 2160 

CCTAGGTAGC AAAATAAAGG CGTAAAAAAA TAATAGCTCC CTTTGTAAAG TTTATTATAA 2220 

GAGAACATTT ATTGCATTTC TATTTTTGTA ACAGATATAA AAACAATCCT ATTACTGCGG 2280 
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GAATAAATAT TCCTAATATC CAGTAAAATG GAAATATTAA 
GTTCACTTCT TACGTCTGTT ATTTTTGTAG AAAGTTCAAT 
CATCTAATTT TCTTATTCCA TTTTTAAATT CATCTCTAGC 
AGCATACTTA TTCTGGTTTC TAGATTTCAT TAATTAGAAT 
TGCTCTACAA CATCTTCTGG AAAATCTTTA TCAAGATGGC 
AATTCTTTTT AGTTTGCTCT TGATATTGCT TATCTCAATA 
TAATAAGTTT CTATGTCTTT TGAATACAAG ATAATAGTAA 
CACTATTATT AATTTCTTTT TATTACAAAA ATAAAAACAG 
GTAGATTTCA TTTTTAATTA AAGATTTAAT AGAAAAGGAA 
ATTCTTCCTT CCTTACTTCC ATCTTTTATT TATTTAAGTA 
TTGTACTATT TCCTTTGCAT TCTTAGCTAT TTGTAATACT 
ATCTGCAAGC TTTGTATTGT TCGTAGTTTC TGTCTTTATT 
TGTATTTTCT ACATCAATTA ACTTATCTTT TGCTTCTACT 
TACGGCCTCT TTAGCTTGTT TTATTTCAGC AGAATCAGAA 
TTCTGATATT TTTTGTTGCT CTTTATACAG TTTTTGCATG 
AAGGCTATAT GCTTCTTTTG CAAGATTAGA TGCAAATATT 
TATTTTTTCT AAATCTATTT CTGCCATTTG AGCTAAATCA 
TTTTACTTGA TCTGCAGCAG ATGAAATTAA ATTAACTGCA 
TT.TATTTGCC TCATTTGATG CATTTAAATT ATCTGTTGTA 
ATTTGTAGTT TGCTTTAATA.- AQ'TGATTTAA.^.CTCACT.TAAT 
GTAATTTGAA TTTGCGCCTT CATTATCTAA ATATCCTTTT 
TGATGATAAT TCTTGTTTAT CATGAACACA AGATATTGAG 
CAGTAGTATT TTTATTAATT TTTTCATATT TATACTCCTT 
TATTTTAATA TCAATTATAT TTCAATATCA ATTATATTTT 
ATCAATTATA TTTTAATATC AATTATATTT TAATATCAAT 
CTACTAATTT CTATTTAGCT TGGCTAGCTT AAGGCTAAGA 
AGGATGTTTA ATGATGCTAA AAACAAGCAA AAAAATTAAC 
AATTTiSCGGT GTTATCTATA AACTATGTGA AAAGCTATTA 
TAATAATAAG TCTTTGAAAA ATGATAGTAA AAGTATGGAT 
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ACCTTTGACT TGTTTACTAA 2340 

TCTTGCTCTT TCTATCTTTT 2400 

TCCCAATCAT TTGCTTTTCA .2460 

TTAAATTGCT AAGTAACATG 2520 

GATATTTTAA AAAAAATTAC 2580 

CTTATTAAGT CAATATTCCG 2 640 

GTATTATATA CAAATAAAAA 2700 

AGTTAAATGT ATATTATCCT 2760 

GGATAAGCCA GCACAAAATT 2820 

TTTAACAAGG CCACAACTTC 2880 

AACTCTGCTG CTTCTTTTAT 2940 
TTATCCAATG TCTCTTTGAC ' ' 3000 

GTAGCTTTCC AAGCTATTTC 3060 

TAGTCAGATT CTGATTCTGA 3120 

TTTTGTTCTG CTGCTTTAGT 3180 

GCTTTATCAC TAGAGTTCTT 3240 

TGCATATTTT TTGTTGCACT 3300 

TTTATAACCG CTTCTACAAC 33 60 

TTTTTGGCTT CTTTTAGTGA 3420 

ATGCTCTGTT TTTTTGATTC. ,3480 

TGATTATTTA AATTAGATTT 3540 

AGCAATAAAA ATAAACTTAA 3 600 

AAATATAATG TCTTAAATTA 3 660 

AATATCAATT ATATTTTAAT 3720 

TATATTTTAA TATCAATTGC 3780 

AAACAAT AGT GAGTATTGAA 3 840 

TTTTATAGAG AATTGTCTTT 3900 

TATAGGTAGC AAGCTTTATC 3960 

TCTCCTAATA ATTTAGATAA 4020 
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CGGTATTTTA AATAATGCAG^RAATACAGT AGAGACGTAA GGCTAGAAG'^PrGATTATTT 4080 

TTATAATGTT GATGAGCAAA TTAATAAAAA AGAATATATC TTAGTATAAT TCCATGCTTG 4140 

ATTACTAATA. TAAGAGAGCC TTCTTTTAAA GAAGGCTCTA ATTTAAATAT ATTAATATTT 4200 

AAATATTTTC TTATTCATTT TAAGATTTAC TTAAAACAGT CTTTGCATTT TCAATAAGTT 4260 

CTTTTATAAT TCTCCTTCTT CCCATGGCCA AACCTCTTTT AGAAGAAGAA GCTTCTAAGC 4320 

TCTTTAAAGC ATCTTCTACT TTATTTAAAG CCTGTCTAGC TAATTGTGAT GCCACTTTAT 4380 

TTTCACTTTC CAATCTTTTA ATAATGCCTT CTTTTAAAAT TTCCTTAGCT TCATTAAAAA 4440 

AGAAAGCCGC AGATCTTATC TCTTGTTCTG CAATATCAAT GTGAACCATA ATTTCATCAA 4500 

GTTCATCCAC TATCTTTAAA TTATTTTGCA ATTGTGTTAG TTCCTTTATT TTATCTCTAT 45 60 

TGTTACGACC ATTTTTTATT AATGATGTTT TTTTGTTCCT AATTTTAGTT ATCACATCAT 4620 

AGAAATTATT TCTTATTAAA GTATATTCAT GTTTAAGTGA ATACATACTC TCAATTAACT 4680 

CGGGAAATCC AGAGTCTCTA AT7VAGATTCT CTATATCTTT AATTGCTTTA TCTGCTTTCT " 4740 . 

TTTCTTCCTT AGTAGAAGGG GAAAGATCTT CTTTTTTTAT CTCTTTTTTT TGATTGTGCT 4800 

TAATTGAAAT GGTTGGTATA CTAACCTTAT TAGCAGATGT CTCTAAAGAC ACTACATGCC 4860 

CTACAGGGAG GACTGCGGAC TCTATATTGC CTACAGTAGT GGGTCTTGTG GATGCTAAGG 4920 

ATTTTGCGAG AGCAATTAAA CTCTCGTCTT TCAATTCCTC AAAATTTTTA AAATCCTTTT 4980 

TTTCTTCTTG ATTCCCATAT AAATTATTAA GAGCATTTTC TTGAACACTA CTACCCAAAG 5040 

TTTCTTTTAT ATCATTGTTA TTTTTTTGGT CTTTATTAGG CAATTTAGAA TCTAGATTAC 5100 

AAGATATCAA TCCTATCGTT AACAATGTAT ATAAAAAdAA ATTTTTTTTG CATi\AAAATA 5160 

TCCCCCTTTC CTCTTTACTG AGAATATATA TTATAAATAA TAATAATTCT TAATTAATAT 5220 

TATATATCAT TT^ ATATAAATAA AAATTTATAT TTATACTTTT 52 80 

TTATTTATTA ATCATTTGCA GAATATTTGA TAAGCTTTGA ACTACTATTT CACTTCAGAA 5340 

AGAAATTAAC AAGTTGTTTA ACTAAAAGTA ACAAAGAATT CTTCACCTAT AATTTCTATG 5400 

AAATTTAGGT GGAGATGAAT TTGCTAATAA ATAGGTTTAT TTTTATTTTG AATATATTTT 5460 

TTGATGATAT CAATAGAGGC GTTCCTCTCC TCTATAGAGA TAAGGCAATA GCTTCTAGAC 5520 

CAAAAATAAG GTTTTCAGCA ATACTTATCT AAATAAGTAT AATATTTTTT CTTATAAATA 5580 

AGCCTTGAAT ATTCTGTTTT TAGATTGTCG ATGAATTTAG AAGGCTAAAT ATTGAGGGTA 5640 

AATTCTAGTA ATAAATGAAT ATGATCTTTA TCATGGTTGA ATTCATTAAG GGTTCTTTTC 5700 

CATAAAGAGC ATATTATATT AAGTATTATT TAGTAAAGGG AAGATGAAAA CCTATCATTT 57 60 

TATGATTTAT GCCTATATTT AGTAACTAAT ACTAGGTGAT AATTAATTGA ATATACACAG 5820 
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TGATTATTAA TGGTTATCTT CTGTGACATA 
TAGAATAATT AGCGCTAATA AAGCTTATAA 
AAATACTTTT CAAAAGTATT TGGATGTGTA 
AAGAAAGATT ATTATGAAAA ATAAACAAAG 
AGAATTTCTA TTCTTAAAGA AAGTTAATAG 
AAACTCTGCA TATAATAATT TTTTAGATAA 
TCTAAATATG AAAGTAAGAA AATAATAAAA 
TAAGAATGGA AAATTGTTAT ATAAAGCTAT 
ATAAGATGCA TTAAAGACAA TGAGCTTATT 
TGATAAATAT TATATTTCAA TAACAGTTTA 
TAAAGGCAAT AAAAAAGAGA TATTTGGTAT 
TAGTGAAGGT TAGAAAATCA AGTATCCTAA 
AAAATACCAA AAAAACTATC GAGAAAGCAA 
TTAAGAGTTG CCAAGCTACA CAAGAAAATT 
TTATCTTATT ACTTTGTATC CAATTATAAA 
GGTATGCAAA AAGGAATGTT TGGAAAAAGT 
AGACAATTAC CATATAAATC AGAATGGTAT 
TTTCCATCAA TTAAACTATG CAGTAGTTGC 
ATACTAGGTG GACTTACAGT AGTTGTAACA 
TAAACCTTAA TTCTTTATTT TGATAAAAAT 
ACAAAGGAAG AAAGCTGCGC TATTTTTAGA 
TAAATTTTTA TTTTTAGCTA AAGCAGGCAA 
GTGCCCaTTT TAATTTCTTT GCCCTTATAG 
TTCTATTTTT TATCTAAGTT TTGATAATTA 
TGGAGATTAA TTTGTTTTCA AAGCATCATT 
AATGTAGGTT TCATTTGCTT CTTCTTTATA 
TTAGAGCTTT ATCTGAAAAT GAAAAACATT 
TTTTTTAGTA AATAGGAATT AATCAGCTCT 
AAGTATTTTT TACAAAAATG ATTTTAGGAA 
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940 




TACGCTTAAG TATAAAATAT TATAAAATGA 5880 

GCATAGAATA TATCTTAACG GCAATCAAAA 5940 

AAATTTTTGT ATAACAAAAT GTTAAGTGAC 6000 

TCTTATTACC TATCCAAGTA AATATAAATA 6060 

TTTAGCTCTT TGTAATGTCC AGCTTGACTT 6120 

ATTAAAAAAG GAAATAGAAC ACAATAATTT 6180 

CTTTTAGAAC TAATAATCAA AAAAACTCAA 6240 

CTAAAATGGG GTTTGTAAAG CTATGTCTAC 6300 

AAAAATGTAT TAGTAGAAAA AAGATGTTGA 6360 

GTGCTTAGAT ACTAAaAATA ACAGTGAAAC 6420 

TGATATGAGT ATGAGATGCT TTTTAGTAAG 6480 

ATATTTACTA AAAAATGAAA ATAAACTTAA 6540 

AAAGGTTATA TTAATAGAGC TAAATCTAGA 6600 

TAAAATCAAA GAAAAGACTT TTTGCACGAA 6660 

AACATAGTAA TAGAAAATTT ATCAATTAAA 6720 

ATTAATAATT AAGGATGGTC TGAGTTCGTA 6780 

GAATCCCCTT TATATAAAGT AGATAAATAT 6840 

CACATTAAAA ATGACTCTAA AATTAAAGTG 6900 

TTTTGTATGA TAGGTATATA AATGCAGGTC 6960 

AAACAGAAAT ATTTAACAGC TTTGCAGACA, .70?0 

AACTTAATTT TTCTTAAGTT GAATAGAACC 7080 

TAGCTAAAAA TAAAAAAACT ATTTATCTCT 7140 

TGTAGAAAGC TTTTACCAGC TTGTTCTTTT 7200 

AATATTAGCG CAATTTATAG ATTTTATTTT 7260 

TGAATTACTT TGCTGTGCTA AGCAGATTTT 7320 

AAAAAACTTT TTCTATGATT GGGTTTTGTT 7380 

TTTTAATGTT GCTATTTAGC GCTGGAACAA 7440 

GTTCCGAGTT TACTGAGTTT TTAAATATTA 750.a 

AGTCTATTTG TAAGTGCTCG TAGAATATAT 7560 
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TCCGATAAAT ATTTGAGTAA^EAATCTCGA AAATATAACC GAAGCAAGGi^CCATTTCTT 7620 

TAATTTTTGA TTTCTAAATG GTATTAATGT TTTTTATTTT CATTGATAAG CTTAAGAAGA 7680 

GGGTATTAAT ACTAACATGC TCTTCCTAGG TAAATTGATT TTTAATAACT TTTTTTAAAC 7740 

GACAGCTGTA ATCCGTTTAT TCTAATGTCA AAATTGGATT TAAAACCTAC AAGCCCAATG 7800 

CCGAGTCTTT TTTTAAGTTT TCATTGTATC TGTTTGCAAA TTTAAAGGGA ATAATAATTC 7860 

TAGTTGTGTA GGATGGTGTA ATCGTGAGTT CTCCTTCCTA TTCCTAATGA . TTCTATTQCG 7920 

ATTGCTTCTG TTGGTGTTTT TGACGGGATG CTTCTGATAA TGTATCCAAG TTATCTCAAG 7980 

TATATTTCCC CGAGTACCTG AGATCTAAGC AATTCACCGT GCTGCCAATA TAATCCTCTT 8040 

GGCCAAAAAA AAGATCCTAT TCCTAAAGTC AAAGAGACAT TTAAAAAGTT ATAGTAATAA 8100 

TACGGGTGCT TTTTCGCTTT CATATTTCAT TACGGCTGCA ATATACTCAA CACCTTTTTC 8160 

AACTCTAACT TATTATCTTG TGTTGCAAAG ATTTGCATTG TTAAACTAAA AATTAATAAT 8220 

AATATGAAAA TTTTTTCATA TTATTATTAC TCCCCTAATA ATAAAGTTTT GATAATTAAA 8280 

TATTAGTGCA AGTTATTAGA TTTTGAGCTT GTAGATTAGT TTTTCTCTAA AATATTATTT 8340 

GAATTGCTTT GCTGTGCTAA GCAGATTTTA ATTTAGGTTT TATTAATTTT CCAGTGAACT 8400 

ACTATTTCTA TAATCTTTGA TTATAGAAAT AGTAGTTCAC TATTAAGCCT ATCCTTTTTA 8460 

TAAAGGATAG GCTTTTACAT GATATCAATT TCAATAACAT AACTTTAAAG GTTGCTTATT 8520 

GATAATATGT TATTTTTCAG CTCTGTTGTT TGGAAGCTTT TTTTTACAAT TTGCTTGTAA 8580 

AGTTCCGTTA AATGAGATTC AAGCTTAGCA ATATCTGTTT TTGTAGAATT TATATAATCT 8640 

TTATAATCTA . ATAAAAGCTG TTCTAACATT TTTGAGATAT CTGTTTTTAT AGATAATAAT 8700 

TTTTCAAACG AATTTTTAAG CTTTTTTAAA TCTGAAACGG TCAGTGTATC TAGAGTCTCT 8760 

TTTTTAAGAC ATAATAAGTG ATTAATCACT GTGTCAAAAG TGCTTCCGAA GTTGCAAAAG 8820 

GTGCCAAATA GGAGGGTTTT TTGTTTTGAT CGAATTAAAA TCTTCGAAAG ATTCGCTAAT 8880 

TTATTGGTAT TAATAGAATT TAAAG 8905 
(2) INFORMATION FOR SEQ ID NO: 17: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8318 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17: 
CTCTACCTAG GACTTTAATT AAAAAATTTG GATTGTnATT CCCAATGCTT TTTCTATCTT 



60 
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GnAAAGAACT TTAAAAGTGC TTTCAAGATA GTTTCTTTTT GCACGTTACT TGAATTTACA 120 

TTCAAATAAT AGGGCAAGTT GCTTTAyATA TACTCTTTAT TTTTTTTGAT TTTTGTATTT 180 

AAGTGTTGAT ATTATTAGTA ATATTTTAAA CTTTACTCTT AACTAAAAGC TTGTTTTATT 240 

GTTAAAAATA AAACACAAAC AATACCCTAT AAATAGTTTA ATATTGCAAT ATTATTTAAA 300 

CTATAAAAAT ATGTAAATAA TAATTTATAA ATTAATAAAA AACATATAAG GGAGCTTTCT 360 

TAATGAAAAT CAAAAATATA GCAAACATAT TAATATTTTT TTTATCTATA GTTTTAAATA 420 

GCTGGGGAAA TGAGTCAAAA ATAAATACCC CAAATGAAAA TTCTCAAAGT AATATTTTAA 480 

TAATCTCAGC TACAAAAGCA GAAATAGAAG AGATAAACAA GATTATTCAA AACAAAAAAT 540 

ATATTTCAAT AGAAGAGCAT AGAAGAAAAA AAAAGATTGC CATTGGGAAA TTAATGGATC 600 

ATAATATAAT TACCATAGCT ACAGGAGTTG GAAAAATAAA TACGGCCCTT TGGACAAGCT 660 

ATATTATATC AAAATATAAA ATTAGTCACA TAATCAATGC TGGAGTTGCT AGTGGAATTT 720 

ATAGTGATAA AAATAAATTT ATAAAAATAG GAGACGTTGT AATATCTACA GAAACAACAA 780 

GTTATGATTT TGATCTGCAT AGATTTGGAT ATGAAATTGG ACATGTTCCA GAACACCCTA 840 

AAAAATTTAA AGCAAACACT GCTCTTATAA GGAAAACTTC TAAAATAAAA ATAAACAATA 900 

TAACCTCATA TATGGGCTTA ATAATTACTG GAGACCAATT CATTGATCAT CAAACTTTTC 960 

AAGAAATTCC AGAAGAATTT GAAAACGCAA TCGCAATAGA CATGGAAAGC GCCGCAATGG 1020 

CTCAAGTAGC ATACGGCTTT AAAATTCCCT TTATAATCAT CCGGGGAATA TCTGATATAG 1080 

TCAATAATGA GAATAATTAC GATGATTATA AAAAATTTTT AAAAAAAGCT TCTTCTAGCT 1140 

CAGCAAAAAT AGTAGAAAAC TTAATTAAGT TAATGTAACT TAATTAAGTT TTTAATTAGA 1200 

TTTTGTATTT TTTTTATTTT TTCATAATCT TCTTTAAGT^H . .TGATTATAGC GCCTT5!TAGT 1260 

AGCTGCACTC ATCTCTTAAA CTTTTATTCC AGAACTATAA AATTACCGTC TCCTTTGCTT 1320 

ATAATAATTA TTAGAGCTCC TTATTAAAAT CAATATTCTT CAATGAATAC TATTTTATAA 1380 

TAAGATCTTC TCTACGCTGT GCTTGATTAT ATCTTTTTTT GATTATAATC CCTCAGCAAG 1440 

TAATATCTTT ATTAAAATAA CTACCCCCAA ATGCTTAAAA GCCAAATTAT TAATCCCATT 1500 

GATACAAAAA GCTCAATTTA ATAATTTATT TTCTTTTTAT AAAAACATTA AATACTCAAG 1560 

ATCTCTTAAC ATTGGCAAGT GAAGCCAAAA TCGATGCTGA AAAATCTAAT AAAGAGGTTA 1620 

ATTCTCAAAA GAAAAGCAAA AACAATAGTA AAAATATAGA AGTAAAAGAT ACTCTTGGGC .1680 

TAGTTAAAGC AATTAAAAAG TCATTATAAA AGATTGATTT GGCTTTTAAA GCATTAATTG 1740 

GGTCGGGCTA TGACGCCTCA TCAACAGCTA AAAGTAAATT TAGAAAATGG CTTAAAGATG 1800 
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ATAAATTTGC TAGATGAATi' WTAAAAATA GCAGCAATTG ATGGAAATGA^AATAACATT 1860 

AGCAAATACA ATGACCTTAA AAAGGTAGTA GATAATTTCA ATAATCAAAA TTCATTAATA 1920 

AAGGTATATT TAAAAAATTC AAGCAATGAA GATAAAATTG AAGCTAAAAA ATGCATAAAA 1980 

ACACTTATGC ACAATGTTGA AACATATTTT GAAAGCGTAT GTGATGAGCT TAAAGATAAA 2040 

AATAAAAATG AGCATAACAG TATATTAACA ACTCTAAATG AGGCAATTGG TAAAATAAAA 2100 

AATTCAGCAA TAGCCATACA TGTTTGTTTT AATATAGATT AATTTTAAAT GCTTTTTATA 2160 

TCTAAAATTT TTTCTTAATT GAGTTAAAGT GCACAATTAA GAAAAAATAA AAATAAATCT 2220 

TTAAGTTATT GCATAAAGGA TTAATTTACT ATGTCTTGTC AGCAGTTCTT TTATAAGCAA 2280 

CATTCCAGCA AGATATCAAT ATAAAAACAC CCAATATGAA AATATGCTAT TTAGAAAGAG 2340 

GAAGAAGAAA AAGTAAAAAA GATAAAATAT TTTAAACCAC TTTCCATTAT GCTAAACTTC 2400 

AATTAATCCA CATGGCTTAA TGATTCACTT TAAATGGCGG CTTTGAATTT CAAAAAAGCA 2460 

CGCTGCCTTT GACATTATAT ATTAATTTAA TTTTTTGGAT TTTAGGAAAA ACATAATTTA 2520 

CCGTGCTATA TCCCTGTAAT TTTGACAAAA TCGTTAAAAT ACTGTAAAAG TATTTGTACT 2580 

ATTTATATTT. TAGACAATAA AGCCTCCCTA TAAAGAACCC ATATTTTCAA TCCAAATTGG 2 640 

AAGGCCTAAA ACATACAATC ATAATCATTA CTAGATTTAT TATTTCTAAA AAAGATCACC 2700 

ATATTTTTAA TTATATCAAC TATTGAAAAA AGGTTTTAGA ATAAAAGGGT AAAATTAATA 2760 

TTAATAATCC ACCAGTAAAC ATTTGCAATA ATAGCATTAC AAGTTTAAAA TTAAAACATA 2820 

TATGTTGAGT AAAAATCCAA AAATCAGATC TGTTTATAGA ATATTTATAA CCAGTTATTG 2880 

CTACGAGTCA CAAAATTCAA AAAATAAAAG AATCAAACTG CTATAATAAT TTTAAACAGT 2940 

GAGGAAGAGT TAATATGATT AAATTCCCTA AAAACCATAT ATCAAAAATA CATATCATAA 3000 

AAGAATATGA GGATGTTACT ATTAAGTGGG ATAGAGAATA CTCATTATTT AGAAAACTAC 3060 

ATGGTAAAAA TAAAACACTT GAAGATTGGT TAGAATATAC CCAAAAAGAA GAAAATCAAA 3120 

AAATTAAAGA ATTTGCAAAT AAATTTATCA AAAAAAGAAA ACCGAAAATA TAAAAATCGC 3180 

AAAGAAGAAT TACAAAGCAT AAATAAAAGT TATATAAATC GGTTACAAAA ACATTGCATT 3240 

GACATTTAAG ATTTTGCAAA AGAGTTCTCT CGGGATATTT TAAAATGGAA AAAATTAAAC 3300 

ACTTTGAGTA TAAATGAGCC TATAAAAAGA TTATAAAATA GAGAATTTGA AAAAATAGTA 3360 
AAATTTTGTT TTACTTTACA ATAGTAATTA AAAATTTGAA ATTATAAAGT AAAAAATGAA . ' • 3420 

TTTTTCAAAC AAAAGGTGTT TATATATAAA AAACCTTACA AAAGAAAATA TCTAATTTGG\.: ^ 3480 

CATAAAGGTT TAAAAAGATA TTTAAAAAAT AAAGAATTTT TTATAAGGGA ATAATTTGAA 3540 

CAATAAAATG GTAAATATTC TGACAATAAT AAGGGATAAT ATATCATACC GTATGTCAGC 3600 
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ATTTATTATT AAAAAAGACT TTAAATTAAA ATGAATCGGG CCAGGACATT AAAATTAAAA 3660 

ATAAGAATAT TTTAATATTA ACCCAAGATA AAAGAAGATT. GATTTCTGAC AGATATAAAA 3720 

GGAAATCCCC TTCTAAAGAA AAATTATTTT ATCTAAAAAA GATCAAATAA GAATAAAAAT 3780 

TAAAAAAATA ATAGGTGGGC ATCTAAAATT TGATTAATGT TTATAAGTAT AAAAAACAAA 3840 

ATAATGTAAA TTTAATCCTA TCAACACAAG ATGAGGATAT TATTTTTTAT ACAAATTATA 3900 

CTTGTTAACA ATAAAATACA TTATTATGTT GTATGATTTC TAATATAATA ATAGGCTTAA 3960 

TCTAAGCCAA TTAAGGAGAA TATTTATGAA AAACAAAATA ATTTTATGTA TGTGTGTTTT 4020 

TTCGCTTTTA AATAGCTGTA A'^TTCGACAA TGATGCTGAA GCAGCAACAA AAAAACATGC 4080 

TGATAAAATA AAAAACTAAT ATATTAATGA AATAAAAAAT TTAATAGCGA TAGATAAAGA 4140 

TU^GTATAGAC AAAAACGAAC TACTGCGGGC TAAACCGGAA AATCAAAAGC CTGCAAACAA 4200 

CAAAAATGAA GAGAAGGCTT TCAAGATAGA TAGCAGAGCT TTCAACTTTA TAAATAGTTT 4260 

TTTAACAGAT GATGAATTCA ACGAATTTGA AAAAATATTT CACAAACCAA AGCTACAATC 4320 

GCACGGCAAG ATATTAAACA GCATAGCAAT TTTAGAGCTT AACCTAGAGA AAACAATTAA 4380 

TCACTTAGAC TTAAAAAAAG ATGCCTTAAA TAAGGCAAAT ACCCTAGATT TGGAAAAGAT 4440 

CAAAAATTCT CTTAAACAAT TATTCTCTAT AAGGAAATTT TTTTCAACAA GCATAAAACA 4500 

GATTTTGTTA GATTATCAAA AAAATACAAA TTCTATAAAA ACAGAGGACT CTAAATTAGA 4560 

AGAATACCTG GACACAATAT TAAATCAGTT TAATGAAAAA AATAAAGAGG TTGGAAATCT 4620 

GAAGAACACC ATATTATCAA TACCTATCCC AACATTATGA ATTAAGACTT ATTAATAAGG 4680 

ATTTTTAAAG CAAATTAGGC CTTTAAATAT AAAGGCCTAA TAAAAAAGTT CATTATTTCC 4740 
TATTAATATT. JSCOT^ GATTTAiU^TA ATTATAAAAA AGCAACCTTA , . ,4800 

TTCACTTCAT AAATAAAACA TACTATCTCC CTAATAACAA ATTTGGGAAA AATCAATCAA 4860 

GAATATATAA AAATAGATCT TAAAAAAGTT TAAGCTACAA TAAATTTATT TAATTTAATT 4920 

AAATACTATG TATTTAATTA AATTAAATAT TTGCTTATAA TAAATATAAA TAAATAAATA 4980 

AATATGAAAC TATGTAAAGG AGGGTATTTA TGAAATACCA CATAATTACA ACTATATTTG 5040 

TTTTTCTGTT TTTAGCTTGC AGGCCGGATT TTAATATCGA TC/^AAAAGAC ATTAAATACC 5100 

GGCCTACTGA AAAATCAAGG CCCAAAACTG AAAGCTCTAA GCAAAAAGAA TCAAAGCCTA 5160 

AAACAGAAGA AGAGCTTAAG AAAAAACAAC AAGAAGAAGA GCTTAAGAAj^. AAACAACAAG 5220 

AAGAAGAGCT TAAGAAAAAA CAACAAGAAG AAGAGCTTAA GAAAAAACAA'^CAAGAAGAAG 52 8X) 

AGAAGGAAGA ACTAAGAAAA. CAACAACTAA AAAATACGCT ATCTAATGAT TTAAAAAAGC 5340 
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AAATAGAATC GGCCTACAAT^TTAAAGAAA AATATGTAAA AAGTATGGAA^KaGAACCTG 5400 

AAGACCATTA CGGGATGACG TCTTTTAGGG GATTGAATTG GGGGCCAGGG ACTGAAGATA 5460 

TATCTGACAA TACCGAAAGA TCTATAAGAT ATAGAAGACA CACTTATACT GTTTTAAGCC 5520 

CCCTGGATCC TCATGAATTA AAGGAATTCG CAAATATTAT TCAAGATATA AATAAACTAG 5580 

CATCAGTAGC AAGTATATTT AATTCTTTTA GCGCTATTGG AGGAGCTCTT GACATAGTAA 5640 

GTGATCACCT ATATTTCAAA AAAGACAATC - TAGACAAACT AGATATTGCA GATTTAGAAA 5700 

TACTTAAAAA TTCATTTGAA CAAATATTAT ATATAAAAGG AAGTGTTGCA GGAAAAGCAA 5760 

AAAAACTTTT ATTAGATTAT AAAAATCTAA AAACAGATAT TAATAAGCTT AAATCTTATT 5820 

CAAATGAACT GGTTAATGGA ATTAAGCAAC AAGCTCTAGA AGCAGAAAAT CTAGAAGAGC 5880 

TTATAGTGTC AAAATATAAA CTTTAATGTT TCGCTTTTAA AATTTATTAA CAATTTAAAA 5940* 

ATGTATATTT AAGCTTTTGT GAAAAAATAT TTTATCTATT TGGGTAGGTA TTAGTATTAA 6000 

TATGGTTTTT GGCTTAGAAA TTCTTATATT ATTTCCCCTG AAAAAGTTTT AGATATCATA 6060 

AAAAACATAT TCAACCCCCT TACAAATTAA TTTATATAAA CCTATATCTA TCTAAAGTTT 6120 

ATATAAATTA TAGGTTAACA ATTCTTTTGC TTTTTAGTTA AAAGCACTTA AAATATAGAA 6180 

TTATTTCCTC AAAGTAAACT ACTTTTTCTA TAAGTCTCTA ATTTGTTAAT TTGCTCTTTG 6240 

TATATACTCT CTTCTGCTGC ACTCTTATAT CTCTTTTGGT CATATGGTAG CGTTTCTAGA 6300 

CAATCGAGTG TTTCTTGCAC GTAATTGATT GCCAAAGGTC TTTAATACCC AATAGACAGT 63 60 

CTTTCGGAAT ACTCACCTCA GCTAATCTAT TTATCGACAC AAATATTTAC ATTCTTGCTT 6420 

TTAAAAATAT TGTTAATAGC TTACATTAAG TTGCTAGTTA AAATACTGTA TTTTTGGAAT 6480 
CTTGGTCAAA ATCAACAACT ATTCCCTTAT TTTTTACTTT TTTTCAAGCA ATGTGATACA ' 6540 

ACTACTCTCA AATTATCTCT TTGTGCTCAG CCGAAAACTC CGCGCTTTAT ATGTACCCCC 6600 

CAATTAACTT TTTGACCTAT TTTTTAAGAG CTCGACAGCC ACTTTGTAAT ATTACATAAC 6660 

CAATATCGTC CATTCCTATA TATATAATTT TGATTTTAAT GTTGATCGTC CAACAAACTA 6720 

ATAATACAAT GCACTTGTTG ATTACTTTAC TTTTAATAAA AAAATATGCT TAAGTATATA 6780 

GACAATTTGT TTATTAGGAA TTTTTGATTA TCATTCAATT TATAATTTTT GTTAGAATAT 6840 

AATTTTTAAA GCATTATTTT TAAATATAAT TATTTTCTTA ATTGAGCTTA AATTTATTTT 6900 

TTATAAAAGT TTTTATTAAT TTTTAGTTTA ATCATAGTTT ACAATTCCCG CTTAGTTGAT 6960 

ATAAAAATAG CATAACATTG TATAAATATA TTTTTATGCA TGTTGGACAA ATGCCTAAAA 7020 

AACAAAATTA ATTATGTATT TATAATAAGT TGTTTTTGTA AAAmACAAAA CCTCAAAATT 7080 

CAAAAACCAC TATAATTTAA AATATGCATT CGAGAACTCA AATGTAATCA AGTTTACTAA 7140 
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AGAAAATATA AAAAGCTCTA AAGAGCACAA AAAAGCTGCT CTATTGGTTA AATAAAAAAT 7200 

ACGCAATTAA AATGTTTGAC GCAAACAAAG CTGTTGAAGT GTATTCAATA GCACAACTCG 7260 
AGAAAAAAAA AATCACGTCA AAAAATTAAA AATAACTTAG ACCATTAAAA AAAGACATAA ' 7320 

ACACTTTATA ATTTTTTAAT TATATAATTA TATTAAATAA CATATCTTTA AAGGATATAT 7 380 

AACACCCCCC CCQATCTTTT TTCAATCCTT GCTAATATGT TTCTTTTCTT TTAATAGTGT 7440 

CTTTTCTTTG ATATTTATTA ACACATATTT GCTAACTAAA TAAAAGATTC TTAACTTTCA 7500 

TAATCATTAT TAATAGATAT TAAATATCAT GTCCAATATT ATATTAAGAC ATGCAACTAA 7560 

CATCTACATT TTTATATAAG CAACTCTACG GCCAAATAGT TAATACAATA TATCAATAAT 7620 

GTTGTCAAAT TAAATTCCCA TTCAATTAAA ATTCAAATAT TTATACCTAT ATCCTTTAAA 7680 

ATTTTTGACA ACGCTATTTA ATTTTTTTAT AAACTTATAT AAGCTTTTAA AGCTTTAATT 7740 

CCCTCTTATT GAATTTTCCA GATCTAAATT CAGATTATTA TTAACAACCA AATTGCTCTA 7800 

ATGTTTTTAT TCTTTAATTT AGTACATATG TAAAAAGTAT TAAAAACTAT TTTTATTGTC 7860 

TCTTAAACAA AAAATTTTTG TAAAAGCTCA GGGCTTATAT AAGTTCTCTG GCCAAAGAAC 7920 

CTATATAAGC CCTGTTTGCC TCTCATAAAA TGATCAAAAA TAAATAGGTA GTTAATATGA 7980 

AAATATTTTT CTACACTAAT TGTAGTATAG ATCAAATTAG AATTAAAATC AACTTGTCTT 8040 

CAGGCTAAAT TGCAATCTTC CCAATTATAA ACATTGCAAT AAATTATTAA TTTTTATGAT 8100 

TTTTTTATAA AAGTATTTGC TTTTATTTAA ATACTGTGCT ATAAATGTAT TTATAAAAAT 8160 

CAAAATAACT AGGAGTATTA ATATGCAAAA TGCATTTCCA ACCGCAAAAA CACACCTTGc . 8220 

CAGAATAAAT TACAACACAA ATTAATAGTT TTTATCTCTA CGCTAAAGTA TATAAACAGT 8280 
.AAATAJ^kAM GATA^J^CCh AAGTAATATA CTTTATTA . . , ..... . 8318- 

(2) INFORMATION FOR SEQ ID NO: 18: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7 624 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18: 

nTTCGCTTTA AATTTAGTTT AAAAnAATAA TAGCTATATT TTCAAATTAT AAATAGTAAT 60 

y. ^ 

CTATTTTATA GCGCTCGACT AGCTGGCAG(3 ATGACTAAAA AATTAATATT TTTTAAAAAA 12 a 

GAGTGTACTC TCATTTATTT TGCCATATCC TCTTTAACAG ATATTTATCA AGAAACCAAA 180 
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AATACTTGCC TTATAGTCTT gCGCAGGAAA TTTCAGGACA TTTAGATATT TTAACCATCA 240 

TGATTTATCC TTATATATTA CCCAATATTA AAAAGAAGTT CTCATTAAAA AGAATAGGAT 300 

TTTGTATTAA TAAGAGTATT AAAAATTAGT TTACTAGAGG ATAAAAACAC TGTAAATGAA 360 

ATACTTCATA CTAAGCTTAT ATTCTGTACA AGAATGTAAT ATTGTGTATC ATAAAAATAA 420 

AAAATATAAT CCTAAAAAGG . AGCGATGGAA ATATTTATTT CTTTGTTTTA TGAGGTCAAA 480 

AATATATAAA AAAGACTTTT TACTGAATTA GAGCGATTAA ATTTATTTGA TTTTTCAGCA 540 

ATCCAAAAAA AATTGAAAAT TGGTTTAAGA TTTTAATAGA GATTTTAGTA ATTTAAAATA 600 

AACAAATATA CTAAAAAGAA ATATAAGAAA AGTAGATAGC AATGGATGTT TGGCAAGGGC 660 

AAAAATTTAT TTGCATATTT CATTTAAATA TGTTTTATTA AAACCAATTT TAGTTTTAAT 720 

AAAACCAAGA AAATTATCAC CTATGTTTTT GTTTATTTTA AAAAAGAAAC AAAAAGCTTG 780 

TCTGTATATT TTTTAATGTA AAAGATTTAG TTTCTTTAAT ATTTAAAGAA TTTCTAGAGA 840 

ACTTTTTAAG ATATTCAAAA TCTTTAGATC TTAATTTTTC TAAATTAATA ATTTAAAAAG 900 

GCTCTTTGTT TCGCATATTA GTTTTGTCTA AATCAGTATA GAATCTATAT TTTATACCAT 960 

TTGTTAATAT GCCGAATTTA ATTTTATATT TAGAATGAAG ATTGTAAAAA TAATTTAATA 1020 

ATTAATTAAA ATGCTTTTCA AGATTTGCCT TGCAATATAT TGGCGTCTAA TAAAATAGTG 1080 

TGTTTTTTAT CTTTAGAATA AAGAACATAT TCAACTTTTT TCATTTTTAA TAATTCCAAT 1140 

TACAACTTCA GTCTGGATAA ATAAAGGATC GGTGTGACAA TAGTGCCTTG CATCTAAAAA 1200 

TGGATTAATA AAAATTGTTT TGTTTAGTCT TAATTTTTAA CAATGAGTTT GTATTTTCTC 1260 

ACTCACATCT TTTATTTTTT ATAAAATTCA TATTTAAAGC TTTATTTTTG CTTGACATGC 1320 

ATAAATTTTA TTATTAATAA ATTTGAATAA ATAATTGATT TTTTAGTTTC TTCTTTATAA 1380 

GAAAAATTAA TATTTATTAA TCAGTAACTT TTATTGAATT TTAAAAATTA AAAACATTTG 1440 

CTTATAAATA TTCTCTTTAA AGTTTAAATA AAGTTTAAAT GTTGAATTAT TTAAATATGA 1500 

TAGACCGTTT GTTTTTTAAA AGTATGGTTG TTTTTGTATT GGGTTAAGAT CAAATTTCAA 1560 

AAATGAGTGT ACAGTATTGA ATTTATTTTT TTTATTATTT TTTCAAAAAA ATTAGAATTT 1620 

ATTAAGTACT GAACTAAAGT TTGAATGGGG TAATTATGAG AGAAATTAGT TGTTGTTTTT 1680 

TATTATTAAC TTTTAGTGTT GTTTGTGTAT ATTCATTTGA TGTTTCAAGT AGAAAATTTT 1740 

ATGGCATATT GGAAGGTTAT" " TATTCGGGC A AAATTGAGGA ATTGTCAAAA AAAAATGATG 1800 

AAGATGTCTA TATATATAGG TTTGGTAAAT TTAAAGAAAC ATTGAGCGAA ATGAGCTCCG 1860 

GGATCAAGTC ATATTTTTTT AATCTTGTTG ATTACCAAAT TGCCAGACTT CTTCAGAATA 1920 

AAGAAGGAAG AAGGAATTCT TCTAAAAGTT ATTCTGTTTT AAAATCCACT CAAAAATCTC 1980 
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TTTTAGAGCT CATTGCATCA ACAGATTTTA 
TTTGCAGGAT CTTGGGAGAT GTTAATTTAA 
TAAGCAAGCT TGCAAATGAG GCTAGAAAAT 
AAAACTCATT TGCCAACACT TCTCTTGCAA 
GGGGAGATCC AAATAAAACT TTGTCATTTG 
ATGTGGAAAA ATATTTTGCA AATATATGGA 
AAAAAGAAAG CCTTAAATAT ATACTCAAAG 
ACAAGATAGT TCTAGAACAA AACAAGGCTG 
ATTAGTTGAA TAAGAAGTTA ATATAAGTCA 
TATATGTTAA GGGCATTGTT AATTTTTTTA 
GAGGTCAAAG TATATATAGA TAAAATAGAA 
TTTGAGTTTG ATTTTTTTTC ACCCGATAAA 
AATGTTATTT TAATGAAATA TAGAAGGGAA 
ATGTCTTTGG TTTTGTGTGA CGTTTCTTAC 
TTGATTCAAA AACTAATTCG CAATTATAAT 
AATGTTCCAG CGGATTATTT TAGGGCATTG 
AATAGGAAAG GATTGTATTC TTATTTTGTT 
AAAATAGATG GTGATAACGT TAAAGCTTTT 
GTGTCAAATA GAGATTTTTA TAAGATTCTA 
GACAGCAATC. TTAATGATAG GCAAAAATAT 
ATTCGCACTA ATAGAAGATT GGAAGCAATT 
CCTAATGGGA ATATGGCTGT GTTGGCAATT 
TACTAGAAAA TTATTTAGAA TTTAATTTCA 
TTTATTTTTA ATATTGCCCT GTTTTGGGGT 
TGATTTTGTA ATACGCGGAG TGGATTTTGA 
TAATTTTGAA AATAATTTTG ATTTTATTTT 
ACCTTTTCTT AGATTAGGAA CCGATTATTC 
TTATGATTT^ AGGAAATTTT TTTCTAAGGT 
TGATTCTAAA AATATTGAAC ATATTGGTAA 
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948 




AAGGTTTGGA AAAAACCATT CAAAGCGATA 2040 

TGCTTTTGAG GTATGCGGGA GGTGCAGCTT 2100 

ATTTTGAAAA GTCCTTAAAA ATTAATAGTA 2160 

GTTGGTATTT ATATGCTCCA AGGATTGCGG 2220 

CTCAATTAGG ATTTAAATAT GGTCAAACAG 2280 

TAAGTCAAGC TCATTTCCTT CTTAAAAATG 2340 

CTGGTGAAAT ATTTCCCAAC GGAGCTTTTC 2400 

GAAATTTGTT TATGGATTTT CCTATAAAAA 2460 

TTTAAGATTT ATGAGTTATG AGATAATTTT 2520 

GTAAATATTA GGCTATTTTC TTTTGAAAAA 2580 

AGCGTTCATA CTAAATATTG TTCTGGTAAT 2 640 

ATTTTTACAA ATGAGCTTCA AAACATAGAA 2700 

AGTATTCAAT ATAATTACTT AAATTTACTT 2760 

TTAATTAATG ATCCACATAA ATACAATGAT 2820 

TGTGCTTTGA AAATTTCTTT AGAAGATGAT 2880 

GGAGAGCTTG CTATAAATTT AATACCGCAC 2940 

AATGCCAAGA GGCATTTAGA AACAGCTTTA 3000 

ATTCCCCTGT CTATTTTATA TACAGTTAGA 3060 

TTTGCAAAAA GCTATATTGA TAGAGCAGAA 3120 

TTGAAAGAAT TAGTGAAAAG TTCTTTTTTA 3180 

GT^TGTTTAA AAAAAGCCAC AGCCATATTC 3240 

GAAAAATTAA AAGAGGGCAA TTCTTTCTAC 3300 

ATGAAGATTG AAGGTATTCA TGAAAAAGTT 3360 

GTTTGCAAAT GAGTTAAATG ATGAGCTAGG 3420 

ATTTCGTCTT GATTATCTTA GTGTTCCAAA 3480 

AAACATTAAG GAAAATGATT CAAAAATCTC 3540 

TAAAATGTTT TTATTTGGCA CTGGGCTTGC 3600 

ATTTTATGAA ATTAGGGTTC CGTTTATTTT 366-0 

TTTTGAGGTT GGTTATAATT TTGATTATTT 3720 
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AAGACTTGAA AATAGATTT/^RtCGGGATT GATGAATCAT TTAATCAAGG^RaCAGAAGC 3780 

TAATGTTGGT GGATCATATC ATAATGCTTT AACCGTGGAA AACACGGTTG CCATTTTACT 3840 

TCCAATTTAT TACTCAGAAT TTCAGCGAGC AGATATTAGA ACGTCTTTCT TATATAAGTA 3900 

TTTATCAGAT AATAATGAAC AGTTTTATAG AGTACATTGG AATTTAAAAT ATCTTGTTTC 3960 

TATTCCTTTT GGAGAATTGG GATTTAAGGC CGATCTTGGA GTGGCAGGCG ATTTTAAAAA 4020 

GTCTTCGTCT TCTATTTTTG AAACCGGATT TGATTATAAT GCTTTAAATT TTTATGCTTT 4080" 

GACTATTCCC AAAATGGGTC AAGACAGTCT TTATTTTAAT GTTGTTTCTA ATTTTGGATT 4140 

AGAGTATAGA TTATTTTTCC TTGAATCATT AAAAAATCTT GCTTCTGATT TATTTTTAGT 4200 

ATTGTCCGCA GATATTGGAT ATGGGATAAA AGAGGATTTG CTTTTAGATA AAGGAAAGTT 42 60 

TCTTTATATT TTGGGTTTTG GAATGGGTTA TAAATTATTT AAGGAAGTTC CTTTTGTTTT 4320 

CAAGGTTGGC ATTAATCAGG ATAAAAAATT ATCATTTGGA TTTTTATTAA GTTCAATAAT 4380 

TTTTGAGTGA TATTTTTTTG GTAAAGCTTT TTAAATTTTA TGGTTGAATT TGAAATATAG 4440 

GAGGTTTTGT GGGGAATGTT AATTTAGATT TAAAATTGGT TAATAAAAAA TACAAAATTG 4500 

GACAAGAAAT TATTCATGCA AATAAGGATA T-TTCACTTAA TTTAAAATCA AGGGACATGG 4560 

TTTGGATTTC AGGGCCTACG GGGAGCGGCA AGACAACTTT AATGAATTTG CTTTCTGGAA 4620 

TAGATTCTCT TGA.TACAGGG GAGAtCCGCT TCAACTCAAC TCTTTTAAGT TCAATGAATG 4680 

AAAAGGATAG AACTTTGTTT AGAAGGTATA ACGTAGGGTT AATCTTTCAG CATTTTGAGC 4740 

TTATCCCAAG TCTTACAGGT TTTGACAATA TTTCATTACC TCTAAGATTC TCAAGAGAAA 4800 

GTGCTAAGCG ATTAAAGTCT AAAGCGGAAG AATTGATAGA ATTTTTCAAA CTTTCAAAGT 4860 

TTGTGAATAA AAAACCTAGA TATATGTCTG GAGGACAAAG GCAAAGGATA GGAATAGCAA 4920 

GAGCCTTTGT TTATGATCCC AAATTAATAA TTGGAGATGA AATAACTAGT CATTTGGACA 4980 

AAGAAACAGC TATTTTTGTT TATACTTCAA TACAAAAGTA TCTTAAAGAG AAGAATGCAA 5040 

TTGGGATTTT TGTTTCTCAT GATTATAATT TAAAAAATTT GGCTAATAAA CTTTATAGAA 5100 

TAGAAGATGG AGTGCTGTCT TTAGTGGGGG GTGAGTGTGT TTAAATTGGC TTTTTACAAT 5160 

ATCTTTAGAG ATTTAAGGCG TACAATCATA TTATCTTTAC TTCTAGCAAG TTCTGTGGTA 5220 

TTTTTATTGG TTTTTGTTGG ATATATGAAC TTTAGTAGAG AGGGGATGGA AAAGAGCTTT 5280 

-GTTAGTTCAA GTGGCCATAT TCAAATTGCG AAAGAAAATT ATTTTAATCC TAAATTTAGC 5340 

AACCTTAAGA ATGGGCTTTT ACTTGAAGAA AAGGATATTA ATTTGATACG GAATGAAATA 5400 

GATAGTTATG ATGAATTACA ATCTACCAAT TTAATAGTTA ATTTTGATGG ACTTCTAGGC 5460 

AATTCTTCGA CAAGTAACCC AGTTTTTGCA TTTGCCTATG AAGATCCAGA TATAATTACA 5520 
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AGCAGCCTAT CTTTATTAGA GGGTGAGCCC ATTTTCCACG ATTCTAATGC AGGTGAGTTT 5580 

TTGCTTGGTA GTAATTTGGC CTCTTCGTTT GGTATAGAAA AAATAACAGA AACCAATTCT 5640 

GATCTTACAT TAATGACAAA TTTGCTCGGG AGAGGTTTGA ATTTCCAAAA TATTAAAGTT 5700 

GCTGGAATTA TAAAATTTCC ATTTTCAACA GCAGATAATA TTTTTGCAAT TACTACTATT 5760 

AAGACTTTAA AAGACTTGTT TGCATTTGAG GGTGGAGCAC ATGTGATCCA AGTATTTTTA 5820 

AAGGATAGTT CTACCTTAGA GACTTTTAAA AAGAAATTAG ATAATTTTAA AAAAAATAAG 5880 

GGGATTTCAT TTGATTATAA TGACTGGTTT GAGATTAATC CTTACTTTAA ATCTGTTTTA 5940 

GGGATGACTA GAACAACATT TATGTTTATA TTGGTCTTAA TATCTCTTCT TATATTTATT 6000 

GCATTTTTCC AGATAATGAC CGCATTAAGC ATTGAGCGCA CTAGAGAGCT TGGTACATTA 6060 

AGAGC/yiTTG GTTTAACCAA ATTGGAACTT TTTTACTCTC TATTTTTAGA AATTGTTATT 6120 

ATTTCTGTTG TCAATATTGT TGTAGGAGTA ATATTGGCTT ATTTTGCTAA ACTTTTTATT 6180 

CAGTTTCAAA AAATTAGCTT TACTCCTCCA GGCTATTCAG AAACATACTA CATCAACATA 6240 

TTTTATTATG CTAGTGATAT AATATATGTT TCAATTTTCA TGTTAATTCT TGCTATTTTT 6300 

TCTTCTATTT TGCCATTTAG CAAAGCAAGT AAGAAATCGG TAGTAGAGGT AATGAATGAT 6360 

GCTTAAGATT TTTGTAATTG TTTTCAATTT TTGTGTTTTA AATTTGTTAA ATGCTGGAGA 6420 

TGGGAAAAGT TTAATAAAAG AATTTGAAAA TCTATATTAT CCCCAATTAA AAAATGGAAT 6480 

TTATGCTTTC AAAATGAATT TTAAAATTAA CGTAAAAAAT AATTTAGAAG AAAGCGTAGG 6540 

GCTAAGAATT ATTAATGTTG ATAATAAGGA TGTGCGTTTA ATTTATATGT CAGGATCAAA 6600 

AACGGATTTT GCCTTTTTAT CTATTAGGAA TAAAGGGCAT TTTATGCTAG GAAGACAAGC 6660 
CAAGATOCCA^ ATTAAGGTAA ,GCTCA^ TAAAGTTAAG GGCGCATCTG AGCTTAAAGA . .,6720 

TATTTTGGGT TTAAGTTTCA ATACAGATTT CGTTTTATTA AAATCCGAAG ACAATAGGGT 6780 

TGAATTTCAA TCAAAAGAAA AATCAATATA TCCATTTGTA GATTTATTAA AAATTAATAA 6840 

AAATGATTTT AAAACTTTAC ACAAAGACAA GAAATTAAAA ATTCTAAAAG AAGTAATTTA 6900 

TAGAAAGGGA AATATTAAAG GAATTQATGC TTTTGTTTAT TTTGAAATTG AAGATAAAGC 6960 

TTTTAACGAT TCTAGTACCA AAATTTATGT GGAAAATATT ATTAGTACTA ATCTGAATAA 7020 

CTCTATTTTT AGCTTAAAAG GATTTAATAG AATATTTGAT TTATATTCAA GGTATATAAA 7080 

TTAAGAGCGT AGAGGGATAG TTAATATTGG TATTTTTTAA AAAATTTTGT TTAATTCTTT 7140 

TTTTGGCTTT ACCTGGTTTT TTGTTTGCGG AATCCTCTTT GTTTTTAAAG GAGCATTTAG 7200 

GATTCAAAAC AAAATTCTCT TTATTGTTGC CCGATGAAGA TAAAAAAGAT TTTTTTGGTA 7260 
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CAGGAGCTTT ACAATTTGAC^RTGAAGCTT ATTTAGGATT TTTATTAAA^^TAAGATAT 7320 




TAGAATTTGG CATTGCACCT TCTTTTATTG TGCAAAATAA TGATCAATAT TTTAGTTTTA 7380 

ATAAATTATT CTTCAATTTA AGCTTTAATG ATTTTATTTT* TAAATTAGGT AGGCAAAATT 7440 

ATTATTTAGG AAATGGATTA ATTGAAAATA TTGTTTTAAA AAGGACCACA ATAGAACCAG 7500 

AATGGTTTTT TGAGTTTTAT TATTTTATTT CTAATTATTC TGTCTCTTTG GGtTCTATGt 7560 

TAGACAAArA AAgCTTArAT AAATTTTCAT CTCCCAAATA TTTATCCCCT TGGCTTTATT 7620 

TTCA . 7624 
(2) INFORMATION FOR SEQ ID NO: 19: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7074 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19: 

ATTGAGGCTT ACAATAAAAA TTCTGATAAC ATTAAAATAG ATAATAAAGC GCTAGAAACC 60 

ACATGGAAAA AAAATACTCC CATCCTCTTT ATCTACTAGA TCAAGCTGAT TAATTTAAAC 120 

AAAAATTAAT AAGTTACACT TAATATTTTT T/i^AAAGAGAA GTTAATTCTT CTCTTTTTTT 180 

ATTyGTACAA TCTAAATCCA CGCTAAAAAC ATGCAATAGA AATTAAATTT TCAATATCAA 240 

ATAAGTTTAA TATTACAATT TGATAwTAwT ATCAAATTGT AATATTATAA ATTTGAACTA 300 

AAATTAATAA ATATTAATTC AAATTTATAA GGAGAATATT TTGAAAAACT TTAAATTAAA 3 60 

TACTATTAAG CTTAACGTTA TTACAGCAAT ATTAACTTTA ATTTGCATAT -CATGTGCACC 420 

TTTTGGCAAT GTTAATCCAA ACAAGCTAAA AAATCCTATC ACCTCTAAAA ACCTAAAAAA 480 

AmCAAAGCGA AGCAACCATT CTAGAAATCT AAAAAAAACA AACAGTCACA CCAATTCAGA 540 

AAATTCAGCA GAAAATAACC AAAATCTTGA AAATGAATCT CAAAATTCAA AATCTTCAAA 600 

TCAAAATCCT CAAGAAGAAA CTGCAATCTC AAAATTAGAA AAAATTGGTA AGGACCTGGA 660 

AGCTCAAAAA AAGGAAAAAG ATACACAAAT AGAAAAAATT AGTAGTGATG CTCAATATGA 720 

TTTTCTAGAG AATTTTAAAC TTCACAACTA TGATTATTTT ATGCATAATA CAAAAATGAC 780 

ATTAAAAAAA ATAATTTACT CATCCCTAAA TTACGAAAAA GAAAAAATAT TGACATTAAA 840 

AGAAATTCTT GAAAAACTTG ATACAGAAGA TAATAACCGA AGAATAGCTG GTCAATTTTT 900 

AGAAACATCA AGGGATATTC AACTTCAACA AGAAGATTTG ATTTTAAAAA AAATACAAGA 960^ 

TACATTACAA ACTCTAAGCA AAGAAAAAGC TGAAGAATTA CTACAACACG CAGAACGCGA 1020 
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TTTAAAGATA AAACAAAACT TTGTAAAAGC TTTAAACGCA ACTATTGAGG CTTACAATAA 1080 

AAATTCTGAT AACATTAAAA CAGATGTTGA AGCGCTAGCA AACCACATGG AAAAAAAATA 1140 

CTCCCATCCT CTTTATCTAC TAGATCAAGC TGATTAATTT AAACAAAAAT TAATAAGTTA 1200 

CACTTAATAT TTTTTAAAAG AGAAGTTAAT TCTTCTCTTT TTTTATTCGT ACAATCTAAA 1260 

TCCACGCTAA AAACATGCAA TAGAAATT^AA ATTTTCAATA TCAAATAATT TTAATATTAT 1320 

TTTAAGCTTA ACGTTATTAA TGAAAATAAT TATGATGATT ATAAAAAATT TATAAGAAAA 13 80 

GCTTCTATAA ATTCTACAAA AACAGCAGAA AAATTGATTA AATTAATGTG ATTATATAAA 1440 

GATCGTACAT AAATAAGGAC TAGGGATAGA CAAAAGAAAA ATACTATTAG CAGAGGCCAA 1500 

TAACAAAAAA TATAAAATGT CAAGCGATTT AAAAAAAAGA AAGAAATGCT CAGTTGCAAG 1560 

ATGTATTTCA TTAATTATTT TTACCAATTC TTTTAGTTTT GATATAACCA GTATTTTATT 1620 

AATCTTATTA ATAAAATACT GGTTATTTAA TTATTTTAAC AATATAGTTA TAATAAAGAA 1680 

AGATTAAATC ATATTCAAGG AGAGTATTTA TGAAACACTA TATAATTGTG CATATATTTG 1740 

TTTTTCTATT TTTAAATGCT TGTTATCCAG TTGCATCTAA TAAAATAGAA TTAAAACCTA 1800 

AAACAGAAAC AAGCTTAAAT CAAGAAGAAG TCCCAAATCA AGAAGCAAAC TACAAAGAAG 1860 

AAAAAGAAGC AAAAGAAGAA GGCATTAATA AAAAAACAGA AAACACGCTG CTTAATGATT 1920 

TAAGAAATTT AATAGAAACA GCTAAAAAAG ATAATGATAA ATATACACAA AAGTTAAAAG 1980 

AAGAATCCTC AAGCCAATAC GGAATACTGG CTTTCAAAGA TTTGTTCTGG CTAGATGGAA 2040 

CAAATGAACA ATTGTCCGCA AATACCGAAA GATCTAAAGC CTATAGAAAA CGAGCTTATA 2100 

GCATCTTAAA TACTATTAAT GACGCTTCCT TAAAGAATTT TTCAGAAATT GTAATGGCAT 2160 

CAGGACAAAC ACAGGGCATA TTTAATACCC TTAACTCACT TGQGGGiTAAT, O^TTGAAAAGA 2220 

TAGTTAATTG TTTGTATCCC AAAAAAGACA ATTTGGAAAA ATTAGAGACT TCAGTTTTAA 2280 

AAAAGCTTAA AGATTCTTTG GAAAATTTTT TAGAGATAAA AAAAATCGCC TCAGAAATGA 2340 

TGCACAAGCT CTTATTAGAC TATCAAAATA ATACAAATCG TATACAAACA GATAAAAATG 2400 

AACTTAAGTC TTATGCAGAC ACACTTTTCA ATCAAATGAC AAAAAAACCC GAAGAAGCAC 2460 

TAAAGCTAAA AAATACCATA TGCTCAATAG AGGACCTTTA ATTTATATAT TGAAATTGTC 2520 

ATAATATAAA GACCTATCTT TTCCTAAAAG ATAGGTCTAA AGTTGTTAAA TACTATTTCT 2580 

AAAAAAAAGA TTATAAATAG CTTCTTTATT TATTCCGCGC TAGCTTTTCA GCTCTACAAG 2640 

AACGGTCGCC CATCAGAGAA TAATCACACA GGCTTTATTT CAGACAATTC TTGCCTTAGT 270431. 

TTTTATTTCT TTATAAGAAT ACGCCTTAGG ATTTAGAGTT GCATTTATAT CTCTATCATA 2760 
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CAAAGTGATA CAACCGCTAU ^lAATCCACAA TAGTGTCGCT TAATTTTAG^^TTATATTTT 2820 

TAATATCTCA TACTCAATAT ATGTACAGCC CAATATTAAA ATCTTGCGAA TTTATAAATA 2880 

ATCTAAAAAC AGTATCTTCA AGACTTATAA AAAATATTTT ATTTATTTGG AGAGGTATTA 2940 

ATGAAAACTT TATCTTTGGT ATAGAAGTTA TTGCCTTATC TCTAATAGAG GATCTCTATT 3000 

GATATCATCA AAAAGTATAT. TTAAAATCAA AATAAACCTA TTTATTAACA AACTCATCTT 3060 

AACCCAAATT TCATAGAAAT TATAGTTTAA GTATTCTTTG GGGGTTTTTG ATAAATTGCA 3120 

TTAATATTTA ATTATTAAAA TTTATTGGGA GGTAATATCA ATATGAAAAA AATTTTAACA 3180 

TTGATATTAA TTTTTAGCTT AACAATACAA ATCTTTGCAA CACAAGATAA GCTTGAAAAA 3240 

AGTGTTGGAA GTATTGAAAC CATTATGAAA TATAAAAGCG AAAAAGCAAC TATACTAGCA 3300 

CCATTCCTTT TGAATTTATT TTTAACTTTA GGAATAGGAT CCTTTGTCCA AGGAGATTAT 3360 

ATTGGTGGTG GCGCAGTGCT TGGATCTCAG TTATTAGGAG GAATACTTTG CATAGCTGGA 3420 

AATATTCTTG GCCATACAGA TGATGAAACA AGAGCAACAA CTGGGCATAT AATAACAACG 3480 

ATAGGAGTAG GCACGATTAT AGCATCCCAC ATAGCCTCAC TTATTATTCC ATTTACATTT 3 540 

GCAAATAAAC ACAATGCAAA TCTTAAAAAA AGACTCGGCA TTGATATTGC GGGTTTTGAA 3 600 

CCCAATTTTG ATATTGGAAT AAGCGGATTC CAACTATCGT TTAAAAAAAG ATACTAAATA 3660 

AAATATCAAA GCTATAAAAA TTAGTTACAA AAAACTACTG TAGTGATATA AATAATAAAA 3720 

TTTAATTAAT GGAAATTTTA TATAAAATAT AAACAAAGAC TTTATAAATT TGAAGATTTT 3780 

CTTGAGAAGC TCATCATAAA AAGAAGATAA ACAGTGTTAA CGTTTATTAG TATAAATAAA 3840 

TCAAAATAAT ATAAATTTAA TCCTAGCAaT AAAAaTGGGA TCTtGTTTTT AGATAGGGTT 3900 

TTTAAAAGAC TTTAAAAAAA TATTAAAACT TAGAAAATAT TAAAAAGACT ATAACAATGC 3960 

ACTTTTATTG TCAAA/^TTA CTTATTTAAT CTAATAAAAA TATCTTATTA TTCTGTCAAT 402 0 

CTTATTGTGT TGTATGTTCT CTAATATAAT AATACAATTA ATCTATACTA ATTGAGGAGA 4080 

ATATTTTTAT GAAAAACAAC ATAATTTTAT GCATGTGTGT TTTTTTACTT TTAAATAGCT 4140 

GCACCGCTAA CCATGAAGCT GAAGCGAAAA TAAAAAAACA TGTTGATAAA ACAAAAAACG 4200 

AATATATTAA TGAAATAAAA T^TTTAATAG CAACAACCAA AGAAATCATC GAAAAACGAA 42 60 

AATTGCTACA AGCTAAACCA GTAGATCAAA ACCCCGTAGA TGATACAAAC AATAAGAAAG 4320 

TTTTCGAGAT AGATAAAAGA GCTTTCGATT TTATAAATAG TTTTTTAACA GATGATGAAT 4580 

TTAATAAATT TGTAACAATA TTTCATAAAC CAACACTAAA ATCACCCGGA AAAGTATTAA ''4,440 

ATAGCATAGC AATTCTAGAG CTAAACATAG AGCAGGTAAT TAATCACCTA GACTCAAAAA 4500 

ATGAGACCTT AAATAAAGCA AGCTCTTTAG ATTTGGAAAA GATCAAAAAT TCCCTTGAAC 4560 
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AGCTGTTCTC TATAAGGAAT TTTTTTTCAA CTUVTCAT/^AA AAGGGTCTTA TTAGATCATC 4620 

AAAACAATGA AAATTCTATA AAACCAGATG ATTCTAAATC AGGAACCTAT TTCGATACGA 4680 

TATACGATCA GTTTAATGAA AAAAATAAAG AGGTTAGAAA TCTGAAAAAA ACCATATTAT 4740 

CACTGCCGAA . TTAATATGGG GGTTTAAGTA AATTAAACCT TTAAATATAA AAGTCTAATA 4800 

AAAGTTTATT ATTTACCATT AATATTGCTT TAATTAAACG TGCAGAAATT TAATTACACA 4860 

AACAGAAAAA TAAATTATAA TTGAAATTAA TCAATAAATA GCAAACAATT GAACCTTTAA 4920 

GAAGTAAAAA TTGCAAAAAC AATTATTTTA ATATTAAAAC AAACATAATA AGAGATTTAC 4980 

TTATAATAGA AAACTTTACT ATTAATTTCA GAAAGGTTAA ATCGACATTA AGAGATAAAT 5040 

TTAAATAAAT GATGTTGATC GGCCCGAAAG CATTCTGAAA ACTGTCAAAA TTAAAATCGA 5100 

AAATTTAAAT AAACTGGGGG GCTTTTAGAA AAAATGAAAA ATGTCTTAAG AATCTAAAGA 5160 

ACAGTGGGCC TTGTTTTATT AAAATAAGCA AGTATGTCCA AATTGTTGAA CCAGTATTAC 5220 

TAAATTAGTA TATTAATTTA TAAAAATTAA TCAAGGATAT ATAAAATAAA TTTTAAAAAA 5280 

GTTTAAATTG TAATAAAAAA TTTAATTTTA TTAACTAAAT AGCTAATATT TAATCAAATT 5340 

AAATGTTTAA TTATAATAAG TATAAATAAA TATGGAATGA TATA/U^GGAG AGTATTAATG 5400 

AAATGCCATA TAATTGCAAC TATATTTGTT TTTCTATTTT TAGCTTGCAG TACAGATTTT 5460 

AATACTGATC AAAAAGGCAT TAAATACCCG CCTACCGAAA AATCAAAGCC CAAAACTGAA 5520 

GACTCTAAGC AAAAAGAATT AAAGCCTAAA ACAGAAAAAG AACTAAAGAA AAAACAACAA 5580 

CTAAAAAATA AACTACTTAA TGATTTAAAA AATTCAATAG AAACAGCTAA TAAGCATAAA 5640 

GAAAAGTATA AAAAAAGAAT GAAAGAAGAA CCCGAAGATC AATACGGGGT ACAGGCTTTC 5700 

AAAGGATCGA ATTGGGGGCC QGGQA.CTGAA GATGTATCTG - CCAACACGGA AAGATCTATA 5760 

AGATTTAGAA GACATACTTA TACTATTTTA AGCACGCTGA GTCTTCATGA ATTAAAGGAA 5820 

TTCTCAAATA TTGTTACAAA TGAAAATAAA CTGGTGCCAG TAGTAGATAT GTTTAATTTC 5880 

TTTAGCTCTA TTGGGACAGC TCTTGATATA ACAACCGATA GCTTATATCC CAAAAAGACA 5940 

ATCTGGACAA ACCAGATCTG TCGGATTTAG AAACGCTTAA AAATTCATTT GAAGCAATAT 6000 

TGTCTGCAAA AGAAAAAGTC GCAAGCGGGG TAATGCAACT TGTAAGAGAT TATAAAAATC 6060 

TAAAAACAGA TATTAATAAG CTTAAATCTT ATTTAAATGA CCTTTACAAT GAATCTGAAG 6120 

AACAAGCTAC AAAAGCAGAA AATCTGGAAG AGTTTATAGT GTCAAAATAT AAAGTTTAAT 6180 

ft. 

GTTTCGCTTT TAAAATTTAT TAACAATTTA AAAATGTATA TTTAAGCTTT TGTGGAAAAA 6240- 

TATTTTATCT ATTTAAGTAG GGATCACTAT TGATATTAAT TTTGGCTTAG AAATTCTTGT 6300 
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ST^TTTACAGAT ATCATAAAAA GCATATTCAG^Al 



ATTATTTCTA CTGAAAAAGT~TTTACAGAT ATCATAAAAA GCATATTCAG^ATCAAAATA 6360 

AATCTATTTA ACAAATTTAT CTACACTTAT AATCCCTGTG AAATTTGGAT GAAAAATCAT 6420 

TTGTTATTTT TTATTAAACT TTAGTTTTAA GTGTATTATA AATTTAATAG TCTAAAAATG 6480 
TGTGAACATT TGATTTTTGC TATTTAAATT GATTTTAATT TTATCTTTTA ATTTTATACT . 6540 

TTTTAGACAC GCTATATATT CTTTTGCCCT CTTTAAATAA AGAATCTTTT ATCATTCATA 6600 

GAGATAAATG ATAAAAGATA TACTGTTTAA TATTAAGCAA ACTATAATTC GATCTTTAAA 6660 

AAAGATTTAA CCCAAAATAG ATAAGTTATA AAGCCTTCTA ATATCTTTTA TTTAAAAAAT 6720 

ATGTTAATAG TATTCTATTT TCTAGCTTCT TCTATTATTT CTAAATTTAT ACACCACAAT 6780 

AATAGATAAT GTACAAAAAA TCAATATTAA TAAAACAAAT GTATTTATAG CACTTATAAA 6840 

ATTAGTTAAA ACCGAACATA TAGCTAATGT TAAAAATGAA AATATACGAG ATATTATGCT 6900 

ATTAATAGAA GTTATAGTCG CTAAAACTTT TGAATCTATA TTTTTTCTTA AAAAATATTC 6960 

TAAATTATTA GAATAAATAG CAATTAAAAT TACTAAAAAT GTGATTACAG CAATAAATAT 7020 

GTAAATATGT GAAACTATTT TTATTAGAAC TGACAATAAA GATATTATGG nTAA 7074 
(2) INFORMATION FOR SEQ ID NO: 20: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6810 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20: 

AATAAAAAAA CACATATTAT GCTCGCAATT TTCAAATAGT GTAATTAAGC TCTTGTATTT 60 

AATAATAATC AAATACCTTT CTCTAAAGTA TAGTCAAATA ATAGCAACAC TAAAAAGTAG 120 

TAATATTCAT TAATGTGAAT CTCTAAATCT CTGGCATACA TTTTAAATGT CATTCAACGC 180 

CTTATCTTCA CAGGATTGCT ATTAATAGGA GAAAGTCTAA TGCACTCAAT TCTCCATTAT 240 

TGCTATCCAC TTAAAGAGAT GGGGGATTTG AAAACATAAA CATAACTAAA CCATAATAAT 300 

GATAAAGTTT TCAATCGAAT GGGTGAAAAA GTATAAGAAT ATTTAAGCTC TTCGAGATTT 3 60 

TTAATTAAAT TATTATATTT GTCTTTTATA GGCCTTAAAT TACAAGATTT TACCTATGTA 420 

ACATAGCCTC CTACAAACAA TTTCCAAACT TCTCCTTCTT TTATlTCGTT TAACCTAGAT 480 

TCTTCATCAA CATAACAAGT ATTGTTATTA TCTTCTTTAA TATTJTTCTT ATTATTTTTT 540 

ATAATTGACC CAATATTTAA AAAACCATTT ATTTCTGCGA TCTTACCTTC TTTGTCCCTA 600 

TACTTATCTT TACACTCTCT TAACTTTTTC GATGAAATCA AAACCCCTCC TTATATTTTT 660 
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TTATATATAA AAGATAAAAC AAGAAAATAA ATAAACCAAA TATAGTCTTT TTGGCTTGTA 720 

AAATTTTATT GGAATTTCAC TTAATATTTC TTTTATAAAT TAAATAAAAA CATTGATTTT 780 

TGCACAAGCA AGGGTAAAAT AAATTCAAGT CTTAATTAAA GATTCTTTTT TTAATAAAAT 840 

CTTTAATCAA GACTTGAAGT CTTTACAATT CACCACAATA ATAACTGGAA GATCTAAACA 900 

AATAC5AACCA CCATTTATAA GTAATATACA TCAAATTTCA AATAAGATCA ACCCTTATTC 960v 

ACAAATTTTT TATTTCTATT ACTAACTACT ATTTTTTAAA TCAAAGATTA TAAAAATAGT 1020 

AGTTTATATC TTATGTTTTA TATACCAAAT TATTCATAAG TGCTCAACTT TTAAATTCTT 1080 
CCATAAACTT TTCTAGCAAA TCTTTTTTCT CTATAAAAAC TCTATCTAAA AAGTAACCAG ^ 1140 

TAAATTTGGC GTTTTTGCCA TAAAAATCAT AACTTTCCTG ATTTTCAAGC TGCAATCTTA 1200 

ATATCCTTAT TGATTTCTCT TTTGCAATGC CCTTATCTAT GTTAAACCTC TTAATCCTAC 12 60 

TATAAGTCTC TGCAAATCCT AGTTGCTTAA TTTCATCTAT TTTTAAATCG CCCGATAGTA 1320 

CATGCTTGTA AAGCCTTAAA TATAAGAATG CTTGACTCCT TGCTATGACA AATTTTTTAA 13 80 

GAAAATCATC AAATTTTTTG' TATCCATCAA ATTTATAAAG TTTTTTAGTC CTTATTTTAT 1440 

ATAAAATTTT CATTAATTCA ATTCTATTGT CTATTTCGCT TGTGGCAATT CTTCTTATTT 1500 

GATTTTTATA GCTTTCGTAT TCTATTTCAT CATCTTTATC ACAATTATTT TTTAATTGAT 1560 

TAATACTGGT TTTTCTATCA TTTAAAATGA TTTCCTTTCG CTCCTTTTTA GACATTAAAC 1620 

CTCCTTTTCT TTTAACAGTA AAAAAGTACG TTCAGCGTAC TTTTACTATT TTCTCCAAAG 1680 

..CTTCTTGAGC CTCTTTGTAA TACACCGCAC TAACATCGGG TTCTTTTAAC TCATTAATTA 1740 

AGACTTTAAC GCTGTTAAAG CTATGAATTT TTCCCTTGAT TAATATACTA TATTTTTTTA 1800 

. . ACACTTGCTT, TTCTACATCT . ATAAATGTAT TTCTATTTTT AATAAACTGA TTTTCCACTA- . 1860 

TTGAAATATC AATCTTTTTA TCTTTAAAAA GATTGACTTC TTCTATCGCA TCCATTAACA 1920 

TAGGAAATGC TTCTACAGAC CATCTTTCAA GCTGAACAGG TATTATAACC TTATTTGTAA 1980 

TATTTAAAGC ATTATACAAC AGAGGACCCA AACTAGGAGG TGTATCAATC AATATGTAAT . 2040 

CAAAATTATT ATTAATTAAA ATTTTTTTTA CACAATACTC TAATAATTGT TCTTTATATC 2100 

TTTTGTCTTC TTGTTCAAAT TTACATAGAA TTGGATGAGA AGGAACAATA TACATATTAT 2160 

TATTTATTTC GTTTAAATAT TTGTTTGGAT CAAAATCCTG ATAATCTTTA AACATGTAGT 2220 

AAACATTAAT TCCTTCAATA CTCTTAATAT GCGTAATGAA GTAGCTAGTT AAACTATTTT 2280 

GAGGATCTAA ATCAACCAGT AAAACTTTTT TATTAAAATT CTTAAGAATG TAACTAAAAA 234G 

TAATTGCTAA TGCACTTTTA CCAACTCCCC CCTTAACTGA TGCAATTGTT ATTATTTCTG 2400 
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TTTTTTTTCT ATCCATTTTT TTATAAATCC TCCATTAGGC AACTTTTTAT T^TAAAATTT 2460 

ATATATTTCT CTTTCTAACT TAATTATTAA TTTAAGTAAA AATTGATTAT ACTGTGTTTC 2520 

TGCTTTTTCT TTTTTAATAA AACGAGACAT TCCCCTGATA TAACAATATA CACTTCCTCT 2580 

TTTAAATCTA AATTCAATAT AATGAATTTT TGAAAATGCA TATGACTTTG TTGTATTGTT 2 640 ' 

TTCTTGATAT TTTACTATAA TGTTTTGTAC TGGCCTTCTG TATCCATAAT ATATACCCAA 2700 

GAATTCATCA TTTTCCTTTA AGGGAAATAA ATtAAATTCA CTAATTTTTT CTTTATTAAA 2760 

TAGTCCTCTA AATGAAACAA AAAATTTATT TTGCTGATTT TTATTAACAC CAAATACATA 2820 

TAAATCACTC ATTATCCTTG TATGATATAT TTTTCTGTTA TTTTTATCTT CCACTTTGGC 2880 

AAAGATAAGT TTTTTTCGTG TTTTTTTTAT TTCTGATTTT TTGATTTTGA GACGCTTTAA 2 940 

TAAACTTTCC ATAACTAATC CTTAATTAAC AATTTATTTA CATGCCTCTA ATTGTGAACA 3000 

CCATTTATTA GGCTCTACTG TCTCTAAGAT CTCGTAATAG. TAATAATTGC TAAAGACCTT 3060 

GCTATATTCT AATCTTTTTT GCTTATCCAA ATAATCTTTT AAAATCGGTA TTAAAATTTC 3120 

AATCTTTATT TTATGTCTTA ATTGTTCAAT AAGTATATTA AAGATATTAT TTCTAATATT 3180 

TGTGTCATTT TCTTTTATAT TTATTTTTTC TTGTTTAAAC TTATTTTTAA GTTTTTCTGT 3240 

TATCTTCTCT AAATCTTCGT ACTTATTTTT TTCTATGATA AAATGTGGTT TATTCTTATA 3300 

TTGCTCATAT ATATCTTTTA TTTCTATTTC TAATTGCTCG CTTTTATAAT TTTCGTTTTC 3360 

TAATTTAATT TTTACTTCTT TTAGTATTCT TTTCAATTTT TGTTGCTTGT TTTTAAGCTT 3 420 

ATTTACTTCT ATTACCTTGA CAACGTTTAA TTTTTCAAAA ATGTTTTTTT CAATTAAATT 3480 

TTCTGCCTTT TTTATCATTT TACATACTTC AATTGTAGCA TCTTTTTTTA ATCCCAAATT 3540 

TAAAATAAGA GAGAATATAT TTGATTTAAA ATTGCATTTC TCAATGTATT TTCTGATTTG 3600 

TAACTTTTCT ATGGATTTAC GGCTGTTTCT TTTTTCTTCT TTATTATTAG ATATATTATA 3 660 

AAAACACTCC CTATTTTTTA CACTACTATT TTCAATGCAA TTCTTATTAA AATATGAATC 3720 

AACACGGCTT TTATATTTTT TCTTTTTTAT CTCTTTAAAA TGTTTATTAA TTAAATGGTA 3780 

ACATACTTTT TTGGGATATT TTAGTTTGTA ATGAACTTCG GTCCCCATGT TAATACCTAA 3840 

ATGTCTGTGG TAGTTACTAG TTACTTTAAA TACCTTTTCT AATTTGTAAA GATAGTTTTG 3900 

TAGTGTTTTT AGCTTAACTT CTTTTTGACA ATTTCTTCTT ATATTATTAT TAAAGTAATA 3 960 

AAGTATGTCA TTTTGAGtGT ATTGTTCAAG ATTTGAATTT ACATAATTCA GTGTTGATAT 4020 

TAGAATGATT AATTTGTGTT GG'EATaTTATT TGTAGAGGTT TTTATACTTT TCATTTTCTA 4080 

CCTTCCATTA TTGATTGTGG TTTATATCAA GGAATATAAT AACTCAATAA GCAATGAAAA 4140 

GTAAACTATT TTTTAAAAAA AATATTGATT TTTATATGGC CAAACTCAGG CACAATGTCT 4200 
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AGCATTTGTC TATAAACTTC CTATCTAGCG 
GTCGCTATCT TTTGTTAACA ATAATTTTAA 
GCATAGGGGT TATTCTTACT AACTCAGACT 
TCCAAATATA ATAATCTTTA GAATTTTTAA 
AAATCTTGCA TCACTAGAAG AAAGTTTAAT 
TACAATTCTT TTAAGTATTT TATCTAAAAT 
TCATCATCTA ATTCACTTAA TTTTTCTTTT 
-TCAAGTCTGG GAGTTGCATG GTCCTTCAAA 
ATCTCTACAC ATATCGGTTA TTTTATCTTG 
ATCTAGAGCC ATTTATCAAA TTCATTAACT 
CATGCTAATT ACTATTTCTA AATCAAAAGT 
AGTCATCATT AAACAACTTT ATTATTAGAG 
TTAATTAAGC TCTAATGGCG GTCACAAATT 
TTACTTAGAA GGATACACCA ATTTAAAAAT 
TATTAATAAA CTATTTAAAT TTTTTCTTTA 
TTTTTATCGA AAAAACTTTG TCTAAAAATA 
AAATAACTTT CTTGATTTTT AAGCTTAAGT 
TTATTTTTGG TTTCCATTAA ATATATATGG 
CATTATCTTT TAATTTATTT TTTAATAATT 
TATCATTATT GACATCCAAA ATATAATT.TT 
CAAATCTTTC TTTATCATTA AATGAATTTA 
TTATGATTTA AATTTCTTAG ATCAATAGTT 
TCCTCGTTTA GTTTAATTTT ATTACTTTAT 
GGGGTTTCCC ATTTTTTTGA ATAAGTTCTT 
TATTATTCCA ATATGGAATT TGATTTAAAA 
TTTGGTTCCA TTTTTCTGAT ACAATGCCTA 
TAATTTTTTG TGTGTATCGG GCTTTTAAGC 
TACTATATAG TCACAATTGA CTTTTAATTT 
AGCTTTGTGC TTATTTAGGT /SkATAGAAATA 
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958 . 

TGTTGATATA TAAGCTTTAA ACAAAAAAAG 4260 

CTTCAAGTTT GCGCAAATTT TCGTCTATTG 4320 

GCACAACTCA CTAGAGGACT CAAAATTCTA 4380 

GTCTCGGTGA AAAATTGGGT TTTTTGAAAC 4440 

CTCTTCAGTA GATCTGGCTG ATTTTACTAA 4500 

TTTCTGTGTC TTTTTCAAAT CACTTGCTAT 4560 

CTCATTTTGA TTTTGGCGTC AAAACTCTCT 4620 

ATAATCAACG CCCACCCCTC CATGACTAAA 4680 

CATAGACTTG TGGACTTCAA CAAAAGATTG 4740 

TAAATCAATA AATTTAAAGT TTATGTAAAA 4800 

CATAATTTTT TATGACAGCT TTTTAAGAGT 4860 

CTTAATTAAG CATTTACACG AGGCAAAGAC 4920 

AAGGTAAATT TTAAATGAAA AACTTATCCT 4980 

AAAAGCAATA AATCAACAAT TCAACAATCA 5040 

AATTCTCTTA TAATTTGTTC AACCCAATCT 5100 

ACTCTGTAAA TTTACAGTTT TTTATAAAAT 5160 

CTTTTATATC CATCGAGTTT ATAATAAACT 5220 

CCTCTATCTT ATTATAGATG TTCCCTTTTA 5280 

CAAATCTTTC TTTATCATTA AATGAATTTA 5340 

.TTATA5RCTTT TAGTTTATTT TT.-TAATAATT 5400 

TATCATTATT GACATCCAAA ATATAATTTT 5460 

ATTTCATTAA TATTTTTTAT TCATAAAATC 5520 

AAATTGTCTG GCGCTGGACA GTTTATATTG 5580 

ATATAAAATA TCAAATTATT TAATATATAA 5640 

GCAAATACCA TATGTTTGCA ATTTTTTTTA 5700 

AAAAGCATTC TTTCTTTGCA TTATTTTCAA 5760 

CTAATGTGTG GCATTTAAAG AATATCTCAA 5820 

TGTTATTTCT ATTTTCAATT CTGAATCAAT 5880 

TCTATTTAAG CTGTATAATG TCAAATGGCT 5940 
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AGGATTAAAT CCAAATGATT TTCTATTTGT AAGTGTAGTT TTACCAACAT CACCTTTTAT 6000 

GCTGGTAATT GTTATTATTT TTGTTCTTTT TCTATCCATT TTGTTATAAG CCCTCCATTT 6060 

GATAATTTTT TGTCGTAAAA TTCATATATT TCTTTTTCCA AAGTTAAAAT AATTTTGATA 6120 

AGAGATTTAT AATATTTTTT TTAATTTTAT CTTTTCTTAA TAAATAAGAA ATTCCTACAA 6180 

TATAAtlAAAA TATGCTTCCT TTCTTAAATT TAAATTGTAT GTAGTGTATG CTTCTGTTTT 6240 

TTCCCTATCA AACAATTTTC TAAATTGGAT AAAAAATCTG TGTTTTTGAT TCTTTTTTGT 6300 

TTCAAATGCA TGAAAGTCTA AAAGTATTTT CGTATGATAT ATCTTTTTTT CGATTTTAAC 6360 

AAAAATTTTG TTTTTGTCTG TTTCGATTTT TTTGTATTTT TCTTTAAGTT TTTCTAAAAG 6420 

TTTTTTCATA GTCTACCTTC TATCTAATAA AGTCTACCTT CTATCTAATA ACTTTTCGGT 6480 

TGTCAAAAAA TTTATTTGTG TTTTTTATTA AATTTAGTAG ATCTAAATAG TATTTGTTGT 6540 

TAAGTAGATA GGAATATTTC GGTTTTTCTA TTTGAATTAA ATACTAACAA CACAAAAAAA 6600 

TATAAAAACC AATATACTTA ACATATTATT TGAACAATTA AAATCAAAAT TTGAAATTGA 6660 

CAATGAAATT TTACTAAGAA TGGTAAAAAA GTATATTAGG TTTATCTATG TTTTTTTATT 6720 

ATTTGGTTTA AATCATCATA TTTGTTGTGA TCGATTATAA AATGAGGGCC TATGTTTGTA 6780 

TTGGTAAATA TACCATTTTA AAAGnCCTTT 6810 
(2) INFORMATION FOR SEQ ID NO: 21: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5805 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21: 

CTTGCATGCC TGCAGGTCGA CTCTAGAGGA TCCCCGTGTA AAAATTGAAT CAGTGCTTGC 60 

TATCCACTCA CCTAGCAAAA CTCTTGCTTT ATATGATGGT ATATCTTTAT ATAGCTTTTC 120 

TTGTGTTTCG ACAAATCCTT TA(CTAAGTAG CACATTATCA TAAGTTGTAA AATTATATGT 180 

CTTAAAGGTC GCTATATTAT CAATATAATC GGTTTTAAAA TAGTGTTCTG GATGATCrGG 240 

ATTAGTATCA AAAATAATAG TTTCTTGCCC GCATCTTAGT CTTTTTAAGA CyTCCTCTAA 300 

AGTTTGCTTG TGTAAAGTTG TAGCCTCATT AACAAAAATA AGTGCCGAAT TACTTCCCCT 360 

AAATCTTTCA AAATCACTTG CCTTATCTCC wCCATATAGA TTAATACGTA GTGAATCAAT 420 

CAGAATATAT GAATTATTTG TATGTCTTGG AATATAAGGA ATTTTAAGAA GTTTACATAG 480 

CTTTTCAAAT TGyCCCAAAA CATTAACTTC AACTGArCGT TGTGAATTCC CAATAATAAA 540 
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ATTATTArTA TCACyAGAGT ATAACTTTTT ATTTTCAATT AAACTTTTGA GAAAAAGATA 600 

ACATGCAAGA TACGTTTTGC CGCTAGCTAT GCCGCCGCTG AGTATAATCT TCTTTTCATT 660 

ATTTTTTTGA ATACTTTTTA TAACATTTTT TTGTTTTATG GTTAACTGTT CTTTTTCAAA 720 

CTTATCAAAA TTAATTGAAG AATTTGTTAG CTTTACAAAT TGTGATATGT CAACTCCATA 780 

TTTATTTTTG TATTCCTTTT GTAGTGTTGT AAAAAGTTTT GTTTGATATA AGTTCACTTG 840 

TACCCTTTAT AACTTTTGTA ATTGCCTTTA TTCTCAACTT CATGAGCAGA AGAAAGTTTT 900 

TTCATACATT CATAGTAAAG CTCCATTTCT CTTATTGAGC ACTCCTTTAC ATATTCATCA 960 

AGCTCACTTT TTAAAGAATT AATTTCTCCA TTAACAACTT GCTTGTTTTT TTTACTACTT 1020 

GCTTTATTTA AAGCATCAAT TTCGGCTCTT AAATTTTCTA TTTTAGTATG CATACTAAAA 1080 

AGCTCAACAC TAGT^TATCG CTTAAATGCA TGTATAAACC CTAATTCTAA ATTGGCTCGC 1140 

TCTAAATCCA ATTCGCTTCT AACTTTCCTA GCGTTAACTT CTGATCTAAA GGTTTGCGAC 1200 

AAAAGGTGTT ' CAAAAGTATC TTCACTAATT GTTAGTCTAG AGTCCTCGCT AACAGAAGTT 12 60 

TCTCCACTTT CCCACTTTTG TCTCATTCTC CACACATTTA CTTTAGAAAC CCTTAGTTTA 1320 

GCTGCTATTT CTTTATCACT TAACGATCCT TCTCTAAAGT ATGCAACATA ATCATTAAT^ 13 80 

GACCTTTTGG CTCTTTTCAA GAAAATTCTC CTAAAATAAC AAAATTAACA ACTTATTACT 1440 

CTAAATAGTA ATTCAATTTA TTAATTATTA ACATTAACTA TTATCTTATT GATATCTATT 1500 

GACAGATGTT TGATATTTAT TGACTTTTAT TGATTTAGAA ATAGCGATTA ACTAATTTAT 1560 

TAAATTTTGC TACAACTTGA CTATACCAAT TTGGAAAAAT CTTTTATTGT TTTTATAAGA 162 0 

TACTTCCTTG TGCAAATTCC CTTATCATAG TAGTGCATGA TTATAAATAA TATATCTACA 1680 
AAGCTAAGAA.CCCCGTCTAT. TGA.TTCTCGT ^T-TrGGATCTT- TTCTACCAAT GTCATGCATA . . - 1740 

ATATCAGAAA CAATACTCAA AAACCGGTCG GAATATTTCT CTCCCATTTT TTTCAAACAT 1800 

TTTTCTAGCA TTCCTTTCTT ATAGCTACAA TCAAACTTCA TATTTTGGAA ATTTTTATAC 1860 

TTTTCTATTA TATGCTTATC TTTCAGAACA TCTTTAATAA AATTTTTTGC AGGGTTTATA 1920 

ATACCATTTA TAATTTCATC AATACTTTTT CCGGTTTTTC TTTTGTATTC TTGTATTGAT .1980 

ACAAAACCTC TATAAAAATC CTTTTTTTGT TCCAGAGTTA ATTGCTTAAC TCCATAAAGT 2040 

TTGCTTATTT CCTTTTTTGT GCCTGGGCTC AAACAATCAT TU^AAATCTGA AATTTCATTT 2100 

ATATACATCA AAACTCTAGA GAGTATATAA ATAAACAATA TTTTTAACAA TAGTTTTTGG 2160 

CATTTTCACT TCATAAGTGA TATAGCTTAA ATAGAAAAAC AAGACTATCA ATTGGCCTTG 2226 

TTTTTCTAAA TTCGATTAAC AATAAAAACT TTTTCTTTAT TCTTTTTTAC CTTCTACAGT 2280 



wo 98/58943 PCT/US98/12764 

TTCTCCAATA TTTTTAAGTT CTTCTTCAAT CTTTTTAAGC GAATTAGTTA^AACTTCATT 2 340 

GGTCATATCG CTAGTATTAT TACCACTAGT CATATTTTTA AACCCCAAAC TATTAGCACA 2400 

CTGCCAAGCT TGTAATCCAA CACCACCTTG TCTTTGGACT TGAGAACCAT GGGTTACTCC 2460 

AGTTGCAGAT TCAGCTTGGT TTTTATACTC TTCAAATTTC TTTTTAGCCT CTTGTAAAGC 2520 

TTTTTTTCTC TCCTCTTTTT TCTTTTTTAA GCTCTCTGAA AGTTCATTTA ATTTATCTTC 258 0 

AAGTCCTTTT CCGTTTAATT TTTCTTTTAT TTTGTTTATT TTTTCTTGAT ACCCAGAATA 2640 

TGTTTCAATA GAAGTTTTTT TAGAGTCTAA TTTTTCTATC TTATTCTTTA ATTCTTGAAT 2700 

TTGTTTTTCA ATTTCTTTTG TATCTAATGT GTTTAAATCT TTTGTCTCTA AAATTTCTAA 2760 

AAATCCTTCA ACTTGTTTTT TTATCTCTTG TTCTGTTTTT TTTACATTTT GTTCTGAACT 2820 

TTCTAAATCT TTCACCGCCC CTTCTAAATC TTTACTAGTT ACATCATTCT TACAAGAACT 2880 

TATCAGCATA AAAATAGCAC AAATAATAAA CATTTTTATT TTTTTATTCA TAAAGATTGT 2940 

CTCCTATGTT GTAAGCGTTT ATTTCAAATT CTTTTTAAAT TCATCTTAAA TTCCTCTAAT 3000 

AAAATTGCAT ATGTATTATC TCTTCCTAAA AATGTAATAA ATTGAGAGTC ATTAATAGTT 3060 

TCTATTTTTG TTTCTATGTT TTTGATTTTA TAATCTTCTC CTTCTTGATA ACCATAATAA 3120 

TCCGCATTAA ATGCTCCTCC TCTAATCATT GAATTTACAA AGTTGTTAAT TTCTGACTCT 3180 

TTTACTGAAA ATAATCTAGC CGTGTGCCCC CCAACATTTA AATCTGTTAC AATACTATAT 3240 

TCTTCTTTTA TTAGATCTAA AGTTCCTAAA TCTATCCAAT TGCCGATATT TGTTTTTTTA 3300 

TATTTAATAT ATACATTAAA ATCAAAAAAT TCGTCAGTTT TTATGCGAAG ATATCCAACT 3360 

AAAGCGCACe TTCTGAAATA AGTAATAGCT GCTCCAACCA TTTGGGGTAC GGTCTTTCCA 3420 

TTTTTAGAGC TGTTTTCATT GGTCCATTGT AATTTTTCTG TAAAAGTTGG CGTATCAAAT . 3480 

GAGTATTTGT ACACAGTGCT TGTACTGTAG AATGTCGTCC TAATATAATC AACTATGCCA - 3540 

TATTGCCCCT CTACAGAAAT TGGATCTTGC GTAAAAAAAA GATCCAAATT ATGCTTATCA 3600 

ATAACGTTTT TAATTTCTCT AACTATGTCA TCTAAACTTC GATAATTATA CTCGTACCCC 3660 

TTAGAATTCT TATTAATCCC TGATAAATTC ATTCTTAGGG TTTTCATATC TTTTCTGAAG 3720 

CTTATTTTTG CTTGAATATT ATTTTGCATT TCTTGATTTT TTTCTGAAAC ATTGTTCATG 37 80 

GGGTTCCCCT TCTAATTATT TTTCAAAATT TTACCTAGCC AATACTTTGC TCATCATATA 3840 

AAGATAAAGT ATTATTTTTA CAAGAAATTA TCAAAACAAA AACTGCACAA ATAATTAAAT 3900 

TTTTCATTTT CTTATTCATA AGTTACTCCA TAAGTCCCAA TATTAGCACA ACAGCTAATA 3960 

ATTGCAATAT TTCAAAGATT TAAATATATA ATTTTGTTAC ATTTCGAATT ACATTGTTAC 4020 

AAAACTAAAA TGTAATTTTA ATCAAACTCA TAAAATCTCT CCATTGCAAA TGCACTACTC 4080 
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ATTATAAGAG ACTACAAAAC ACATACAAAT TAAATTTCAA AGTCTTTGCT ATATATTACA 4140 

CAAAGTATTG TATCTTTCTT GTGTACCACC CTTAAAAATT GCCTCTTCTG TTTATCCCAC 4200 

CTGCTCTACA GCCCAGATTT TGCATGCAAT GAGAACTCAC AAAATTTGAC TAAAATTTTT 4260 

AGTTTTTGGT ACAATATAAA TTACATTTTT CATCTATTTT TATTACTTTT ACTTAATTTA 4320 

AAAGTAACAC TTATAAGGAG CTTGTCTTAT GGATACTAAT AATTCTTTTA ATTTAAATAA 4380 

TTTCAATATG GATTTTACGC TCAAACTATT TCAAGAATAC CAAAATGCAT TAAATAAAAA 4440 

CAAAATTCTA GAAAATGAAA ATAAAATTCT TAAATCTCTA GAAAATTCAC CTAAACGTAA 4500 

GAAAAAAAAT TCAAAACCAA CTCCTAAGTT TTATTTGACC CCTAAAAGTA TTAAATTAAT 4560 

TCTAAAATGT GCCAAAACCC TAAAACAAAT TGACCCAATT TGTGGTTGGT TTGTGCATCT 4620 

ACTCTTAATA AGTGGATGTA GAGGCACTGA AATGCAAAAA GTAAAAATGC AAGATATTTC 4680 

AACTTTTTTA AGCAAAACCG GAAAAACTTT ATATACTATT AAAGTAAATG TGGCAAAAAA 4740 

AAGAAATACC TCTTGTATTA GAGAAATTGT CATCAACTCA GAAGAGTTCG AGGCTATCCA 4800 

AACAGCACAT AAAAATCATT TCCAAGAAAA AACTCTTGAC TCGCGACGTA CTTATCTTTT 4860 

TCAAAAGAAC AAACATAAGT TTAAAGATAA CCAAATTGAT ATTGTCCATA TTTCTAAAAA 4920 

ATTCAAAAAT CTTCTTAAAA AATCGGGATT TCGTGTAAAT AAATCTCTCC ATCTATGTCG 4980 

AAATTTATTT ATTTCAAATT TGAAATCTAA CGGCTACAAT TCTTTTCAAA TTAAAGAACT 5040 

TATGAAATAT TCTTCAACCA ATGAAATTGA TAATATCTAC GGitlCTmTCTT CTGCTAATAA 5100 

AATTCAAGCT TATGAATGTG CTAAAAAGTG CCTTAAACTT TAGTAAAACT ATTTCAGTTT 5160 

AAATATACGC TTTGAAGTTA CTTTAAATAT TTTTCCACGw GGctTTcAAG TCAAGTGAAT 5220 

^CATATAATAOJ^TTGTTTATTT TTTGTTGCTA TAAAGTGATA .TCCATTAACC -TTATCGATTT --5-2-80 

TAACTTCrCT TATTTCAAAT TCATTGGCTG CACCTAAATA ATTTAAAGAy TCATATCTCA 5340 

CrCTACTTCT AATTCCGTAr TAATTAAGTA TCATACATrG ATTTATAATA AAACAATTGC 5400 

TCTTAATATA TCCAAGTCCT ATAAATCTAT AATACGCTGC ATTTATCTCA TAmrCAyTAA 5460 

ATTCACGTTT CTTAAATAGA CTTGTATAAT AATGTAGACA CAAAAAGTAA CAACCCCATT 5520 

TTTGTATCTC CAGTCTTAAA GTTCTATTGT CTtGTTTTAT TTTATTAATA AGCATTAATT 5580 

AATCCTCCTA TATTAAATTA TTTTTTTAAT TTTTTAGTGC ACCCATCACA TGGGGACACT 5640 

AACACTATTT GCAAATGCTA TATTACTAGG GAAAAATACT GTACCACTTG TTGGTAGTAG 5700 

TCCCTTTAAT CTATCTGATA TGCCCnTTTC TTAGGGnCAA GAGTAAACAC AAACTCTCCA 576& 

AATTTATAAT TAACnGCTCA ATAGTGGGTA nGTATCGGAA AATGn 5805 
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(2) INFORMATION FOR SEQ ID NO: 22: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5377 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22: 

CTCAAGATTA AGTAAAGCAT TGCGAACTGC ACTGTAAGTT GTGCTTTTTG AAGAAATATG 60 

TTCTTCAATA GCAGCCCAAT AAGTACCACC AGGTTTCATT TTAGAAAAAA AGAGATTGAG 120 

CTCATTAATT ATTTCTTCTT CAATTAATGC CAAAGAAGAC GCAATAATGT TATAAATTGA 180 

GCTTTGATTG TCGTCAATAT TAaTroCCaTA ATTTACaCGC AAaTATTCTC TTTTmGmTCT 240 

TACAaTATCC yTAaTTGTAC GTTTTAT^AAT GCCAAAATCA GAATCAAAAA CTATrCTCAT 300 

AAATTAAACT CCATATTyAA AACaTCGCCg aGAAAAAAAA GGATATATGT GCTTTGTTGT 360 

CTTGTATAGT AGTTGAAATA TTTATTAAAT CTAAGTTAAG CTCTTTAGAT ATTTCATGAA 420 

AATAATTTTT TACAGCGTGA AGATTGTTAA TTTTTAACAG CTTTAAAAGC AAGAAATAGT 480 

CCAATCCCCA ATGAGGAGCA TAGCTTAAAC TACCCCTTAA GGTTTTTAAA AATATCAAAA 540 

ATCTTTGTTT TTGTTCATCA ATTCCATCAA CAAGTGATAA ATCGTTATTA AATACCAATT 600 

CAAAATTATT GCCTAATCTT AAATCCATAC TAGTAATTAT ACCATATTTA GCAAAAATTA 660 

CTTAAACAAA CTATTAATAT CAGAATTAAT TTGAGCGGTT GCTATTTTTA AGCTTGATTC 720 

GTCAATTACT GAGTCCCCTA TAATTTTTAT ACCATTGATA GCACTAACAA TATTATCTAG 780 

AATTTTTTTT AAGCTAGTTG TTTGGTTTGC TATTTCAATT TTATTATTCG CTCTAATTTT 840 

AACAGTATCA GAGATTAGAT TTAAAGTCTT TGGGCTAATT GCACTAAGTA TATAAAAATG 900 

ATGTTTGTCA AAGTGAATAT CGTTATTTTT ATCAAAAATA TTAATGCTTG ATTGAAGTAG 960 

TAAAACGywA TCACCTTTTG ATArTTCTAA ACTGATATTA GAGATATTTT TTGTGTGAAT "1020 

TTCTAAATCT TCAAATTCGG GTATTGTAAC AATAGCyTCT TGAGTTTGwT GTTTAAACTC 1080 

CTTTACAGTG CCAATTTTAA TTATAAAAAT GTTTGAATAA ATCCAATTTT TAACGTCCTC . 1140 

TTGTGCTAAA GCATGACCAT AAAGACGCTG GTTCATTCTG TAAATTTTAT AGTCTTTAGT 1200 

CATTTTAATC CCCTTTACTT TATGCATTTA ATCAGAATCA TCAGAATCAT CCTTTAATTT .1260 

AAGTATTAAT GAACACTCTC CTGCGTTGCT AAGTCTTGCA CTTGTTTCTT TTATGGTGGT 1320^. 

TTTTATCATT TTTCCTAATC CATCAATAAA TGAAACTTTA TCGCCAATTT TTAATTTATG 1380 

TGTGTAAAAT GTTTGTGCGT TCCAATATAC ACGTTTTATC TTGTATTCAC CTTCAATAGC 1440 
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AATTTCTTGT TGTGGAATGA ATTCAAGTCC 
TGCTTCAGTT GTTATATCAT TAGTAAATAT 
ACCAACATCA GCTATTACGT CATGAATATA 
TGGTGTTGTG GCATAAATAT CTTTTTCAAT 
AATAATATTG CGATTAGGAA ACACAGATTC 
GTTTTTGTTC TCTAATTTTC GATCAAAGAA 
CTCAACACTA AAATCACCAC CAGGATAATC 
CATTATGAAA TCAAAATTTT TTTCATGAGC 
TCCTACTTCA ATGTCGTTGG TGAAGTCTAA 
TTTAGATTTT ACAAAATTAT AATTTGAAAA 
TCCATGTTGT GTATTTATTA TAATTTTGGG 
TGTATCCTTT TCTAAGGATT GTTTTGCTTT 
TAGCAACATT AATTATCCTT TATATTTTTC 
TAGACTAACT TCAACTTCAT CAATGAAAGG 
AGCTAATTCT TTTAGGCCAA AAGTTGGACT 
TCTATTTGCT AGTTGTTCTT TTGCAAGATG 
AACAGTCATT TTGAGCAAAG AAAGCATTTC 
TAATGAGATA TTTTCACCAA TCATTACTGG 
GTAATAGTTG ATAACTGGTC TTTTGGAACA 
GGTTTTT^T TTO ACAATTGAGG 
TGGAAATAAC ACTAAAAAAT TATCTGCTCC 
TCTTATTATT CGAGTAATCT CCCAGAATTC 
GAATTTTTTC TTTTCAAGAT TATTATTGAT 
TCCTTTTTAT TTGAAATTTC CTAAATCATC 
AATCGTATTA TTAATCCAAC CAGTCGCGAA 
GGTATTATAT AATGAGCTGC CAATGTTTTT 
TGTTATGGCA TCAACGATTT GTTTTAAGAT 
AAGAATACCA GAAATTTTGC CAATTACTGG 
ATTTTGCTCT ATTTTAGCTA AATTACTTTT 
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ATAATCTTCT AAAGCTTTGT AATTTTCATC 1500 

AAAATTACAT TCAACATCAA AGCTGTCACC 1560 

TATTCCTTTT ATTTTGTCAA CAAATTCTTT 1620 

GATTTTAAGA CGATCTTCTT TGTCCATATT 1680 

TATTGCCTCT TGCACCGTTT TCCCCTTGAA 1740 

GTTGCTACTA ATTGCTAACC GAACGTCAAG 1800 

AGTGCTCATA GGAGTTCCTA AATACCCCGA 1860 

AAATTTTTTA TAGTGTATTT TTACTATATC 1920 

GGGCAAATTC CAAAGTACAA TTTTTGTTCG 1980 

CTCATTAGAT ATGGTAATAT CAATATGAAT 2040 

AGTTTCTTCA ATTAAAGAAT CTCCAGAGCT 2100 

GTAAAATTCA ATTTTAAAAT CATATTGTAG 2160 

CAATTCAAAT GTTTTTACAA TTTCTATTGA 2220 

AACATCCTTA AACGAAAGAC TTGTAATTAC 2280 

GTAGATACTA AAGGGAACTT GAGCTTGTAT 2340 

CACGTCAAAA CGTAGCATAG TATTGCCAAA 2400 

TTTATATAGT GAGGTTAATA CCCCACCATT 2460 

ATTGTAGCTT ACATATTCCG CTTTTCTATC 2520 

ACTGGTATTG TAAGTGCGTG CTATGAGTTC 2580 
AACATATCCA AAACCTTTTA AATCCATTCT . .2640 

GAAAAGAGCA AATATTTGGG TTATTACATC 2700 

TTTCTTTTCA ACATCTTTGA TTTTTTCCTC 2760 

AATATTTTTA TTGTTAATAT CCATAGAATT 2820 

ACCCCCGGTG TTATT6TTGT TCTTTCCAAA 2880 

GTTATAAGTA TTACCAACAA CATTACTAGC 2940 

TATTCCGTCA AAAGCACCCT TTATACCGCC 3000 

TTGTTCAAAA TTAAGGTTCA TAATCTTTTC 3060 

CATCAAAACA TTATTAGTTA CGTCTTCAAG 3120 

AGCTAAAGCA ACTTCATCAG AATGACCCAT 3180 
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TATATTCAAA GATGATATAT^TTTTATTAA GTCTTTAATT ATCTCTGGCC^'TAGCTTTTT 3240 

TTTCCCTCCC TCTTGAGTTA GAAACTCTAA CTTGTTTTTC ATGGCTTCTA GATATTTTTC 3300 

TCCAAATTTG TCTATAGGTT TCAATATATT GAAAGCTTCT GTAAGTTCCC CTTTAAGTAT 3360 

TTTTGAAACA ACTTCAACAG CACTTTCGTT ATCACCAACA AGCCCCGTAC TTCTAAACAT 3420 

AGCTGCTAGT TTTGTTGCAT TTAATACATT CTCTCCCTCT TCATCATTAA TTTTTAATTC 3480 

CCTGATGTGG CCTTTAAGCA CACTCGATGT TCGCAGAAAG TCTTGTTGTT CTAATTTCCG 3540 

CTCAAATCCT TTCATTCCCT TAATAGCACC CAAAATATTT TCACGTTCTT TTTCACTGTA 3 600 

AAACACTTTA TTAAGTTGTT TTAGTTGTTC TTCTTTAGAT TTATTTTCAA CTGCTTTTTt 3660 

AGCAAATCCA TACATAAATC CAATAAGCCC GCCACCAACT TTACTTACAG CGTTGCCAAT 3720 

GACATTTCCT AAAGCACTAC CTATTGCAAT TTTGGCAACA AGTCCTTTTC CTTGAGAAGC 3780 

TGCGAGCATT TTACTTTTTG CTTTTGATTC TTTTGCAAGC TCTTTATACT CAAGGCGTCT 3840 

TTTGTCTCTA TCAGACATCA AAGATCTTTT GAAAGCTTCT TTTCTTGCTT TCTCAAACCC 3900 

CATGCCCTGT TTCATAAGCT TTTTAGTCTG TGTAAGTCTA TATTTCTCAA CACGCTCTCT 3960 

TAAGCTTTCA AATTTAGATT GTTTGCTAAG TTCTTTTTTC TTGTCCGACA AATTATTTTT 4020 

TACAATATCT TTAGTGCTAC CCAAACTAGA TTTTTTGGGT TTAAGATATT TTTCCATTTT 4080 

GGAAATATCT TGTTCAATAG CCTTTTTTGT TGCAGCATGA TCAAGAATCC CTTTAAATTT 4140 

AATGGTGAAT TTGTCGCTCA TTAAGCCCTC ACTTGCTTAA AATTAATTCA TACAATTCTT 42 00 

TTTCTAATTT AATATCAGCA AGTCTATTTA CCTCTAAAAG CTCGTCATAA GGCAATTTCT 4260 

TTACCGAGTC GTATGAGCAA ATATTCATAA TTACTGGAAA ATAGTATTTG TCGTTCTTAA 4320 

TTTCGTCAAG CAAGTTAAAA TACTTTTTTC TAGTCTCATT AAGACTTGCA ATGGCTTTAT 4380 

CAATATCTCT ATTTCTTTTG ATCATTTAGC AACCAGCTCA TTGGAATTTG ATGTACTTGA 44 40 

TGAAAGCGAA GTGGCTACTT TTTCATAATC . AAAGTTTTCA TTGATATAGT CAAAAGTAAC 4500 

AAAGTCCCCA ACATTATTTT CATACTCACT CAAATATACC AAAGCGGGTT TTTTTAGATC 4560 

ATTGTCTAAA TGAAAAGTAT TAAATTGTGC GGTGTAAATT ATTGCAACAA GATAGTCTTT 4620 

ATAATAAGAA ATAAATTCTC TATTTTGATC CAAAATCACA TAGAATTCGT CTAAAAATTT 4680 

TGGACTTATC ATTAAACTTG TGATTTCTCT TAAGTATTGA ACCTCATTAA GCTTTAAAAC 4740 

AGCGTCACTT TGATTAAATC CGAGTACTCT ATCCCATTCA TAGACCGGCA ATACTTTTAG 4800 

TGGATATTCA TAAGTTTTAT TTTTAGTTAA AATTTTCATC TTATATCTCA TTATCATAAT 4860 

AAGACTCTCC TTTTAAGAGT TGTTTGGTTT AGATTTTTGG CAATTAATAG CCCTAATTTC 4920 

AAAAGATACT TTTTCGGCCT CAGCAGAATA ACTTCTTGAA GGCTCTTCAG TAAAAATTGC 4980 
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ATAGTTAGAA ATAATTTTGG TAGCAATTCT ATCATTGAAT GCTAAATCAA GCATTTTATC 5040 

CTCTTTTCTC ACATCCATGT TGTAAAACTG TTCATCAGAA AGTTCAGTTA ACAAAATGTA 5100 

GTCATGACTA CCCAAAGTAA CTTCAATGTT GAAAACATAA GTTATCGTTT TGGGATCTCT 5160 

TAAGCTTATT ACAGGCATAC CTTTATCTTC ACTACTAATC ACTGCTCTTG TTGTGGGTTC 5220 

GCTTCTAAGT TCTAGTTTGC CACTATGTAG CTGTGTACCA CCAATTGAAA AATAAACTTC 5280 

TCTTAAATCA TAAAATTGCA TTTTTAGCCC TCCTTTTAAG CACTTAAGCT GTTTTGATAA 5340 

TCAACTATAT CTTGAGTAGa ATTACTAAAG AAACAGC 5377 



(2) INFORMATION FOR SEQ ID NO: 23: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5121 base pairs 

(B) TYPE: nucleic acid 

(C) . STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23: 

CnTTTGCTGT TATAGTATCT AGATTATCtT GTGCCGAATT TATTACAGCT GTTAATGAAT . 60 

TTAAGGATGC TACTGAAAAG TATGCTAATG GCAATAAAGG AGACCATGCT GTTGATGTTG 120 

TTGTGGGTGC TATTGCAGGC ATAGCTTTTG ATAATGAGAA TAGATTTGAA AGAGCCAAAA 180 

TGTTTGCTAA TAAGGAAAAA GGTGCGGAGG TAGACAAAAT GATTGCTGCC ATTGAGAAGC 240 
TAAGAGCTAC TTATACTGCA GTTAAGCCTA AAAATAAAGA TAAATAAATA ATAAATGTAA . ; . 300 

TAACTGGGAA AATACAGAGA ATATTCTTAA GCATTTTCTA TTGAGCTTTT TGTATACATA • 3 60 

ATTTATTTTG GTTATGTTTT ATTATGTTTT ATTTTTTATA GGATATAAAT AGACATATAA^ 42,0^, 

GTCTATAAAA ATATTTGTCA CACAAGACAT TCATGTAATC ATTTATTTCT ATTATTATTT 480 

GATAAATTTG CTCAATATGG CTTTTTTAAA AAAATAGGGC ATATCTTTAA AACCCTTATC 540 

AATAAAGCAG CATTAATGAT AATTTTGGAA ACATTTGCTA CACGTACAAG ATATTAAACC 600 

ATTTTTTTTC TTAGCATTAA TATCATTATT ATATATTTAA AAATAAGCCA CGATTAAGGA 660 

TCCAAATCCT CCTGGGACAA CATATGGGGT TGATCGTATA TATTTTAGCC CCTATTCCAT 720 

TAAAAATAAC ATTTGATAAT TCATTTAATT TAAAAATGAA TTATCAATTA CAACAAACTC . 780 

CATGTGATAA GATGGATAAT TUVCTATCGGA TTTTTCTTAA TCCCATTATC TAGCATCCGG 840 

AGCTTTCAGA GTAAACATTT ACATTTGATT TTTTATTAAA GAGCTGCTCT TTTAATATTA 900.. 

CCAGACTAAA ATTATTTAAA ATAACATTTA CACATAATAA CACTATCTAT TGGACTTACT 960 
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GAATCATACT AAGATAAAG^TOTTGGCAAA TATATTTTGG TTGAACAAA'^KtTAAGAAG 1020 

TGTTAAAACT AATGAAAAAT CCATTAATTT TAAGGAAGGT TTACAAAACA TAAAAGATTT 1080 

CTTCCTGCAA AGTTATTTAC CTAAATATGC TTAATAGTAA TAGCTTAAAA GCGGATATAA 1140 

ATATTATTGT AAGAAGAGAG TCGACAATTT TGATACTACT TAAAGGTTTG GATTATTCTA 1200 

TTTCTGCTTT GTTTGTTTTA AAGCGATTTA TGGTTTGAGG CTTAATGTTG ATTTTTTTAC 126.0 

CTTTTTTTAT TTAAATTTAT TTACAATAAA GCTTTTACTA TAAATGAATT ATGAATATTT 1320 

TAATAAGAAC AAGTCAkATC TCATAATTAG TGCAATCAAG AAAAAAAaTT AGCACATATC 1380 

CATTTATGAT TTAATTTCTA CTATTTAGAT CAGTGGTGAT GCATTATTTT AGCTTAAAGG 1440 

AAAryTATAA CTVATAGTTAA AGTACAGTAG ATGTrCTTTA ACTTATCACC TATATAAATA 1500 

CAACACTAAT TAATAyATAA ATAGAAATGA TTATTTTCAT AATATAyCAT AAGCAAGCCG 1560 

TTTACAAGCT TCCGCTATAG mACTGGCAGC TTCGCTTAGC AATTTCAATG ACTCGCCA/^ 162.0 

CTGTCCCGAT GCACTCTTAG CACCCTGCAA CAACTCACCA CAAACACCAT TGCCATTACC 1680 

TTTAACGTCG CCAAGGTATT TCTCTACATC TTTCATTAAC TCATTTATAC ATTTTTTAAC 1740 

CAAATCTTTT CCTTTTGTCT TAGGATAAGA ATTCAAGCTC ATTATAGAAC AACTATACTC 1800 

ATCCTTTTCA TTTTTATTAA ATTCATCTAC CACTTTCTTT ATTTTCTCGC AGmTATTATC 1860 

ATCAAAATTA TCATTATCGC TATCATTTAT TTTTGGCATC ACAGCTTCTA ATATCTTrTC 1920 

TAACAAGCAT ATTCTACCTA TCCCGATCTT CATATTGTCT GAAAGAGGAT ATGAGGCATC 1980 

ATATCCTGAA GCTATCAATA GCTTTAAAGA TTCATCAATC TTTTTGGCTG ATTCTCTAAT 2040 

ATCTCTTACA AGTGAGGGAA CCTCTCCCAA TGCTATACTA GCATTCCCCT ♦ TTTTACTACT 2100 

TAAAACCTTA TCTTTAGATT CCTTGGCAGA AATACTAGCC TTTTCAACCA TATCTTTAGG 2160 

ATTATCCTCC TTACTTAAGG CCTTAATTTC CAATGCAGAT TCAAACATAC CTTTTACACC 222 0 

CACAACCTTA GGATTCGAGT GGCCACCACC TTTTTCCATA GTGTCATTTA AATTTGAATA 2280 

TCATAATTTA CAAGACATTG CTAAAAAGCC ACTAAACAAA TATAAATATA TTTTCATCAT 2340 

ATTTAAACCT CTCTTTACAA GAGTAATTTA CATCAyTTTA TTAGGATTAC TACCTATCCG 2400 

GCATTTAATC TTTCTGAGAT TATCTATTTT ATCTATCAAT GTAAAGTTAA ATGAACTGCC 2460 

AAATTATTTG TTATATTTAT ACTCTTTGTT AGCTTTATGT TTTTAAGTTT TTAAACAATA 2520 

TCTATCTTTT TGCCyTATAA TTTTATCTGC GCCCAGCTTC ATAATACACT CATCTTGAAT 2580 

ATAACATGAA AAAATATAAT ATrCCAACTA GAAATCTTAT AATTCAATTT TTAGTTCAAT 2640 

ACTAAACATA TTGTAAAAAG GAGTATCCTT AAGATTTATC TTTTTATTAA ATTCCAATAT 2700 

ATTTGACACC TTTAAAGAAC ATTCTTTAAG AATTAAAAAA TTATTTTCAA AATAGAATTG 2760 
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CAAGGAATGA GTATTTAGAT TGGTTCTTAA AGAAACCGTC GTTTGGAGTA GCTCATAAAT 2820. 

CCATGCTAGT TTGATCCCAG CTCCCAAAAA ATAATTATTA TTCTTCGAAT AACTCTCAAA 2880 

TACTATTGAC AAATCATTAA AAACGTCATT TTCAAAGCTA ATATAATATC TAAGACCAAG 2940 

CAAAAATCTA TTGTCATCAT CATCAAATTT ATAATTTTTA GACCAAAGTA GGTCTTGTCT 3000 

TAACGTAGAG TAAAAAAATA TTCCACTATA AATTTCAAAT AAAAAATCAA AAATAACAGy 3060 

AATATCAAAA GTTTTATTTT CAATGCTAAA TGGGAATTCA ACCATTGCAA GTAAATCAAC 3120 

TTCATTAAAA GATGCTTGAA AATAAAGCCA AGGGGATAAA TATTTGGGAG ATAAAAATTT 3180 

ATCTAAGCTT TCTTTGTCTA ACATAGAACC CAAAGAGACA GAATAATTAG AAATAAAATA 3240 

ATAAAACTCA AAAAACCATT CTGGTTCTAT TGTGGTCCTT TTTAAAACAA TATTTTCAAT 3300 

TAATCCATTT CCTAAATAAT AATTTTGCCT AACTAATTTA AAAATAAAAT CATTAAAGCT 3360 

TAAATTGAAG AATAATTTAT TAAAACTAAA ATATTGATCa TTATTTTGCA CAATAAAAGA 3420 

AGGTGCAATG CCAAATTCTA ATATTTTATA GTTTAATAAA AATCCTAAAT AAGCTTCATT 3480 

GkCAAATTGT AAAGCTCCTG TACCAAAAAA ATCTTTTTTA TCTTCATCGG GCAACAATAA 3540 

AGAGGAATTA CAAATGCCAA GTCAATAAGA TTCCCAATAA TTACTACAAC ACATAAAAAA 3600 

GAATTTAAAG AAAAAACAAA ACTTTGCGTT GTGCGAAAAC TTTAACTGCA AATAATATTG 3660 

AATCTTACAA TCAAAATTTT GGAGATATTA AAACAAATAT AAAACATTTC GAAGACCATT 3720 

TTATGAAAGA ATACTTTGAT TTTATTCTCC GGATTAAATC TATTAAATCT ATACAAATTG 3780 

TTGTACTTGA TTTTTTAAAA AGAGAAGAAT TATAACTTAT ATTCTTAAAT TTCATGCAAT 3840 

CTAAATTTAC GCTAAAAACA TCAATGGAAA TTAAATTCTT AATATTAAAT AAGTTTAATA 3900 
^TCATTTGACA_ ACAATATTAA^ A TATTATTTTT . AACTAAA|LTT AATATT-TATT . - .3960 

AATTCAAATT TATAAGGAGA ACATTTTGAA AAACCTTAAA TTAAATATTA TTAAACTTAA 4020 

CGTTATTACA GCAATATTAA CTTCAATTTG CATATCATGT GCACCTTTTG GCAATGTTAA 4080 

TCCAAACGAA CCAAAAAATC CTACCACTTC TAAAAGTCTA AAAAAAACAA AACGAAGCAA 4140 

CAATTCTAGA AATCTAAAAA ACACAAGCAA TCACACCAAT TCAGAAAATT TAACAGGAAA 4200 

TTCAACAAAA AATCCATCAG AAAATAACCA AAATCTTGAA AATGAATCTC AAAATTCAAA 4260 

ATCTTCAAAT CAAAATTCTC AAGAAGAAAC CACAATCTCA AAATTAAAAA ACATTGGTAA 4320 

AGACCTGGAA GCTCAAAAAA AGAAAGAAGA TACAGGAATA ACTAAAATGT CTAAAATTGA 4380 

TAATGCTAAA TATGATMTC TAGAGACTTT TAAACTTAAA CAAGATGATG TTTTTATGTT 4440 

TCATGCTAAA ATGAAATTAA AAAGAATAAT TTACCCATCC CTAAATTACG ATACAAAAAA 4500 
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AA^TCTTGAAAA ACTTGATACA GAAGATAAT^fci 



AATATTGGTA TTAAAAGAAA^TCTTGAAAA ACTTGATACA GAAGATAATA^CCGAAGAAT 4560 

AGCTGGTCAA TTTTTAGAAA CATCAAGGGA TATTCAACTT CATCTAGAAG ACACGTATTT 4620 

AAAAAAAATA CAAGATACAT TACAAACTCT AAGTGAAAAA GAAGCCGAAA AGTTGCTACA 4680 

AGGTGTAAAA CTTGATTTAA AGAAAAAACA AAACTTTGCT AAAAGTTTAA ACGCAACCAT 4740 

TGACGCTTAC AATAAAAATG TTGATAACAT TAAAATAGAT AATAAAGCGC TAGCAAAACA 4800 

CATAAAGGAT AAATATTCCC ATCCTCTTTA TCTACTAAAC CAAGCTGATT AATCTAAATA 4860 

AAAAAATAAT ATGCTGCACT TTATATTTTA AAAAGAGAAG AATTAACTTC TCTTTTTTGT 4920 

GTTCATACAA TCTAGATTAT CACTAAAAAC ATGCAATAGA AATTAAATTT TCAATATCAA 4980 

ATAAAAATAA ATTTAATATT GTTATTTTGA ATTAAAACTA ATGTTTAGTA ATTCAAATAT 5040 

ATAAGGAGAG CACATTTTGA AAAACCTAAA TTAAATATTA TTAAGCTTAA CTTTATTACA 5100 
GCAATACTGA ATTCAATTTT C .5121 
(2) INFORMATION FOR SEQ ID NO: 24: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5107 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24: 

GCTGT6AAGG GTAATAATGA GAAAGAGAAG GCTGAGGGGG CTATTAAAGA AGTTAGCGAG 60. 

TTGTTGGATA AGCTGGTAAC ACTGTAAAGA CAGCTGAGGG GGCTTCAAGT GGTACTGATG 120 

CAATTGGAGA AGTTGTGGAT AATGATGCTA AGGTTGCTGA TAAGGCGAGT GTGACGGGGA 180 

TTGCTAAGGG GATAAAGGAG ATTGTTGAAG CTGCTAGGGG GAGTGAAAAG CTGAAAGTTG 2*40 

CTGCTGCTAA AGAGGGCAAT GAAAAGGCAG GGAAGTTGTT TGGGAAGGCT GGTGCTAATG 300 

CTCATGGGGA CAGTGAGGCT GCTAGCAAGG CGGCTGGTGC TGTTAGTGCT GTTAGTGGGG 360 

AGCAGATATT AAGTGCGATT GTTAAGGCTG CGGATGCGGC TGAGCAGGAT GGAAAGAAGC 420 

CTGCAGATGC TACAAATCCG ATTGCTGCTG CTATTGGGAA TAAAGATGAG GATGCGGATT 480 

TTGGTGATGG GATGAAGAAG GATGATCAGA TTGCTGCTGC TATTGCTTTG AGGGGGATGG 540 

CTAAGGATGG AAAGTTTGCT GTGAAGAATG ATGAGAAAGG GAAGGCTGAG GGGGCTATTA 600 

AGGGW3CTGC TGCAATTGGA GAAGTTGTGG ATAATGCTGG TGCTGCGAAG gCTGCTGATA 660 

AGGATAGTGT GAAGGGGATT GCTAAGGGGA TAAAGGAGAT TGTTGAAGCT GCTGGGGGGA 720 

GTGAAAAGCT GAAAGCTGCT GCTGCTGAAG GGGAGAATAA TAAAAAGGCA GGGAAGTTGT 780 
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TTGGGAAAGT TGATGGTGCT GCTGGGGACA 
TTAGTGCTGT TAGTGGGGAG CAGATATTAA 
AGCAGGATGG AGAGAAGCCT GAGGATGCTA 
GTAATGGGGA TGGTGCGGAG TTTGATCAGG 
CTGCTATTGC TTTGAGGGGG ATGGCTAAGG 
AGAAAGAGAA GGCTGAGGGG GCTATTAAAG 
CAGCTGTAAA GACAGCTGAG GGGGCTTCAA 
ATAATGnTGC kAAGGyTGCT GATAAGGCGA 
AGATTGTTGA AGCTGCTrGG GGGAGTGAAA 
ATAATAAAGA GGCAGGGAAG TTGTTTGGGA 
AGGCTGCTAG CAAGGCGGCT GGTGCTGTTA 
CGATTGTTAA GGCTGCGGCT GCTGGTGCGG 
CTAAAAATCC GATTGCTGCT GCTATTGGGA 
GTGATGGGAT GAAGAAGGAT GATCAGATTG 
AGGATGGAAA GTTTGCTGTG AAGAAGGATG 
GAGCTAGCGA 6TTGTTGGAT AAGCTGGTAA 
GTGGTACTGC TGCAATTGGA GAAGTTGTGG 
GTGTGACGGG GATTGCTAAG GGGATAAAGG 
AGCTGAAAGT TGCTGCTGCT AAAGGGGAGA 
AGGCTGGTGCr TAATGCTCAT GGGGACAGTG 
GTGCTGTTAG TGGGGAACAG ATATTAAGTG 
GTGATCAGGA GGGAAAGAAG CCTGAGGAGG 
ATAAAGATGG GGATGCX5GAG TTTAATCAGG 
CTGCTATTGC TTTGAGGGGG ATGGCTAAGG 
AGAAAGAGAA GGCTGAGGGG GCTATTTU^G 
AAGCTGTAAA GACAGCTGAG GGGGCTTCAA 
CTGATGCTGC TAAGGTTGCT GATAAGGCGA 
AGATTGTTGA AGCTGCTGGG GACAGTGAGG 
CTGTTAGTGG GGAGCAGATA TTAAGTGCGA 
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970 




GTGAGGCTGC TAGCAAGGCG GCTGGTGCTG 840 

GTGCGATTGT TAAGGCTGCT GGTGAGGCTG 900 

AAAATCCGAT TGCTGCTGCT ATTGGGAAGG 960 
ATGAGATGAA GAAGGATGAT CAGATTGCTG . -1020. 

ATGGAAAGTT TGCTGTGAAG GGTAATAATG 1080 

AAGTTAGCGA GTTGTTGGAT AAGCTGGTAA 1140 

GTGGTACTGA TGCAATTGGA GAAGTTGTGG 1200 

GTGTGACGGG GATTGCTAAG GGGATAAAGG 1260 

AGCTGAAAGT TGCTGCTGCT AmAGirGGrsA 1320 

AGGCTGGTGC TGATGCTAAT GGGGACAGT6 1380 

GTGCTGTTAG TGGGGAGCAG ATATTAAGTG 1440 

CTGATCAGGA TGGAGAGAAG CCTGGGGATG 1500 

AGGGTAATGC GGATGATGGT GCGGATTTTG 1560 

CTGCTGCTAT TGCTTTGAGG GGGATGGCTA 1620 

AGAAAGGGAA GGCTGAGGGG GCTATTAAGG 1680 

AAGCTGTAAA GACAGCTGAG GGGGCTTCAA 1740 

ATAATGCTGC GAAGGCTGCT GATAAGGATA 1800 

AGATTGTTGA AGCTGCAGGG GGGAGTGAAA 1860 

ATAATAAAGG GGCAGGGAAG TTGTTTGGGA 1920 

AGGCTGCTAG CAAGGCGGCT GGTGCTGTTA .1980. 

CGATTGTTAA GGCTGCTGGT, QAGGCTGCTG 2040 

CTAAAAATCC GATTGCTGCT GCTATTGGGG 2100 

ATGGGATGAA GAAGGATGAT CAGATTGCTG 2160 

ATGGAAAGTT TGCTGTGAAG GATGGTGGTG 2220 

GAGTTAGCGA GTTGTTGGAT AAGCTGGTAA 2280 

GTGGTACTGC TGCAATTGGA GAAGTTGTGG 2340 

GTGTGACGGG GATTGCTAAG GGGATAAAGG 2400 

CTGCTAGCAA GGCAGCTGGT GCTGTTAGTG -2460 

TTGTTAAGGC TGCGGCTGCT GGTGCGGCTG 2520 
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971 

ITGCAGAGGCTA AAAATCCGAT TGCTGCTGC'I^T'I 



AGCAGGATGG AGAGAAGCCT GCAGAGGCTA AAAATCCGAT TGCTGCTGCT ATTGGGAAGG ' 2 580 

GTGATGGGGA TGCGGATTTT GGTGAGGATG GGATGAAGAA GGATGATCAG ATTGCTGCTG 2640 

CTATTGCTTT GAGGGGGATG GCTAAGGATG GAAAGTTTGC TGTGAAGAAT GATGAGAAAG 2700 

GGAAGGCTGA GGGGGCTATT AAGGGAGCTG CTGCAATTGG AGAAGTTGTG GATAATGCTG 2760 

GTGCTGCGAA GGCTGCTGAT AAGGATAGTG TGAAGGGGAT TGCTAAGGGG ATAAAGGAGA 2820 

TTGTTGAAGC TGCTGGGGGG AGTGAAAAGC TGAAAGCTGC TGCTGCTGAA GGGGAGAATA 2880 

ATAAAAAGGC AGGGAAGTTG TTTGGGAAAG TTGATGGTGC TGCTGGGGAC AGTGAGGCTG 2940 

CTAGCAAGGC GGCTGGTGCT GTTAGTGCTG TTAGTGGGGA GCAGATATTA AGTGCGATTG 3000 

TTAAGGCTGC GGATGCGGCT GAGCAGGATG GAAAGAAGCC TGCAGATGCT ACAAATCCGA 3 060 

TTGCTGCTGC TATTGGGAAT AAAGATGAGG ATGCGGATTT TGGTGATGGG ATGAAGAAGG 3120 

ATGATCAGAT TGCTGCTGCT ATTGCTTTGA GGGGGATGGC TAAGGATGGA AAGTTTGCTG 3180 

TGAAGGGTAA TAATGAGAAA GGGAAGGCTG AGGGGGCTTC AAGTGGTACT GATGCAATTG 3240 

GAGAAGTTGT GGATAATGAT GGGAAGGCTG CTGATAAGGC GAGTGTGACG GGGATTGCTA 3 300 

AGGGGATAAA GGAGATTGTT GAAGCTGCTG GGGGGAGTGA AAAGCTGAAA GCTGTTGCTG 3360 

CTGCTACAAG GGAGAATAAT AAAGAGGCAG GGAAGTTGTT TGGGAAAGTT GATGATGCTC 3420 

ATGCTGGGGA CAGTGAGGCT GCTAGCAAGG CGGCTGGTGC TGTTAGTGCT GTTAGTGGGG 3480 

AGCAGATATT AAGTGCGATT GTTACGGCTG CGGCTGCTGG TGAGCAGGAT GGAGAGAAGC 3540 

CTGCAGAGGC TACAAATCCG ATTGCTGCTG CTATTGGGAA GGGTAATGAG GATGGTGCGG 3600 

ATTTTGGTAA GGATGAGATG AAGAAGGATG ATCAGATTGC TGCTGCTATT GCTTTGAGGG 3660 

GGATGGCTAA GGATGGAAAG TTTGCTGTGA AGAGTAATGA TGGTGAGAAA GGGAAGGCTG 3720 

AGGGGGCTAT TAAGGAAGTT AGCGAGTTGT TGGATAAGCT GGTAAAAGCT GTAAAGACAG 3780 

CTGAGGGGGC TTCAAGCGGT ACTGATGCAA TTGGAGAAGT TGTGGCTAAT GCTGGTGCTG 3840 

CGAAGGCTGC TGATAAGGCG AGTGTGACGG GGATTGCTAA GGGGATAAAG GAGATTGTTG 3900 

AAGCTGCTGG GGGGAGTAAA AAGCTGAAAg CTGCTGCTGC TGAAGGGGAG AATAATAAAA" 3960 

AGGCAGGGAA GTTGTTTGGG AAGGCTGGTG CTGGTGCTGG TGCTAATGGG GACAGTGAGG 4020 

CTGCTAGCAA GGCGGCTGGT GCTGTTAGTG CTGGTTAGTG TGGGGAGCAG ATATTAAGTG 4080 

CGATTGTTAC GGCTGCTGGT GCGGCTGCTA GTGAGGCTGA TCAGGAGGGA AAGAAGCCTG 4140 

CAGATGCTAC AAATCCGATT GCTGCTGCTA TTGGGAAGGG TGATGCGGAG AATGGTGCGG 4200 

ATTTTGGTGA TGGGATGAAG AAGGATGATC AGATTGCTGC TGCTATTGCT TTGAGGGGGA 4260 

TGGCTAAGGA TGGAAAGTTT GCTGTGAAGA ATGATGATGA GAAAGGGAAG GCTGAGGGGG 4320 
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972 

CTATTAAGGG AGCTAGCGAG TTGTTGGATA AGCTGGTAAC AGCTGTAAAG ACAGCTGAGG 4380 

GGGCTTCAAG TGGTACTGAT GCAATTGGAG AAGTTGTGGC TGATGCTGCG AAGGCTGCTG 4440 

ATAAGGATAG TGTGAAGGGG ATTGCTAAGG GGATAAAGGA GATTGTTGAA GCTGCTGGGG 4500 

GGAGTGAAAA GCTGAAAGTT GCTGCTGCTA AAGAGGGCAA TGAAAAGGCA GGGAAGTTGT 4560 

TTGGGAAGGy TGGTGinTirmT GCTCATGctg GGGACAGTGA GGCTGCTAGC AAGGCGGCTG. 4620 

GTGCTGTTAG TGCTGTTAGT GGGGAGCAGA TATTAAGTGC GATTGTTAmG GCTGCkGrTG 4680 

CGGCTGAGCA GGAkGGAAAG AAGCCTGCAG AkGCTAinAAA TCCGATTGCT GCTGCTATTG 4740 

GGAAtAAAGA TGAGGATGCG GATTTTGGTG ATGGGATGAA GAAGGATGAT CAGATTGCTG 4800 

CTGCTATTGC TTTGAGGGGG ATGGCTAAGG ATGGAAAGTT TGCTGTGAAG GGTAATAATG 4860 

AGAAAGGGAA GGCTGAGGGG GCTTCAAGTG GTACTGATGC AATTGGAGAA GTTGTGGATA 4920 

ATGATGCGAA GGCTGCTGAT AAGGCGAGTG TGACGGGGAT TGCTAAGGGG ATAAAGGAGA 4980 

TTGTTGAAGC TGCTGGGGGG AGTGAAAAGC TGAAAGCTGT TGCTGCTGCT ACAAGGGAGA 5040 

ATAATAAAGA GGCAGGGAAG TTGTTTGGGA AAGTTGATGA TGCTCATGCT GGGGACAGTG 5100 

AGCTGCT 5107 



(2) INFORMATION FOR SEQ ID NO: 25: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5068 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double' 

(D) TOPOLOGY: linear 



..... -.(xi) SEQUENCE DESCRIPTION: SEQ. ID NO: 25: . , , . . 

CACATTATTA AATCTAGAAT TGAATAATTA TTCTCAAAAA AAACTATTAA AATTTTACAA 60 

CGAAATTCTT AAAAAAGATA ATAAAAATTC TTGCGATCTA CCAACAATGA ATAAATATCT 120 

TGATATATTA GAAAAAACAA AAACCATAGT AAAACTATCT TTTAAAAACC AGTCCAAATA 180 

TATGATTTAT TATAAAATTA ATTACCCCCT TAAAGTGTTT CGTTCAACAA TACAAGACTA 240 

CTATCAAACA ATArCAGATA AAQTAAAACT ACGGTTAGAA CTAAACTATC CTACTACTAT 300 

TTAATCGTAA AAAATATTTC TTTGCAAATT AAGCAATTTA GAAATATAAA TGTAAAGACA 360 

TATATTTTTA TTTGATAAAT AATAAAAATT ACTGGGGCAC TATTTGGAAA AATTTTTAAA 420 

AGAAATATTA AGTATGAATA GCAAAAATAG GCTATCTTCA CACTTAATAA TTCTTATTTA 489 

' CACACTAAAC AACATTGACC TAAATTCAAA AAATATTGGA TACTATAGTA GGGGCTTTAT 540 
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973 flMi 

ACGCCGTGCG TTTACTTTT^^CATAGATAG ATATTGCAAT ACTAGTAAA^^&ATTGAAAT 600 

AGACATAGAC TTATTAATAA AGTATCTCGA TTTTTTAGAA AACAACCTAA AAATTATAAC 660 

TAATAAATAT AAAGTAGAAA AAAATATATT CAAACTTTAC TACATAATCA ATTATCCTTT 720 

AAAAATATGT TACACAAAAA TTATGAACTA CTATAAATAG ACTATATAAT GATATTAAAA 780 

AGAGAAACAT CTTTAGTATA TTACTAAAGG TGTTTCTCCC CTTAATCTAA AGTTGTTTTA 840 

AGGTGTATAA TGGGGGTGAT ACCATATTTT AAATTATATA TCCCAAATTA ATtAAAAAAT 900 

CAGGTATTGC AAATGTATTA TAGTGTCTCA TAGGCCTAAT AAAGAACAAT TAAAACTAAA 960 

AAATATATAA ATAAAACGCA AATTAGAAAA AGAAATAACC GTCATAGTCA AACTTTATTT 1020 

TAAGAAAAAT CCTAAATCTA TAATTTATTA TAAAGTTAAT TGCTCCTTAG AAAGAGTTTT 1080 

ATTAAAAATA AAAGACTACT ACGTATTATT CTATGAAGAA TTAAAACAAT TTTTACAAAA 1140 

AATCACTACT ACTTAATTAT AAATACATTA TAAAATAAGC TTATGCAAAA CTTTAGAAAT 1200 

ATATTGTTTT ACGCTAAAAA AATTTAAAAA AATACTGTGC TATATTTATA ATATAAATTT 1260 

AATATAATAG GGGGCTAATT CATTATGGAT GGAGTAATTA ACAATACATT GGCAAGAATA 1320 

ACAAAGCAAA TTTAATTTGC TAAGAATAAG TTAATCATTC TTGTCAAAAC ACTAGATCAT 1380 

ATGAATAAAA AATTATTCCA TAGTGCAAAT AAAAATTATG CTTATTCCTT AATAAGAAGC 1440 

AAGTTTAATA AGGCTCTAGC TAAAACT/^T CAACATGAAG TTGATTCTAA AACCCTGTTA 1500 

GAATATCTTG AAATATTAGA AAAAATCCAA AAGTAATCTT CAAATGTTCC ACAAATAAAG 1560 

AAAATGAAAG CTTTAGAGGC CTTTAGTAAG CTAATATAAT CCAGAAAATT TACTATAAAT 1620. 

CGATTATATA AATAGTAAAC CAATATCTAT CCTAGTGTAT TATGGCCTAT AATAGGCCCA 1680 

ATAAAGATAA TAATAAGCTT ACTATATTAC AAAACTAAAC CCTCGCTATA TTATGAAAAT 1740 

CAATACTAAA ATAATGGGCA CTTAAAGCAA TTGGTTAAAA TAATTTCTAT AAATGCCTTT 1800 

AAAAATTATT GAATATTAGA AAATATTATA TCAAAATCAT TTAATTGAAA TTAAATAAAC 1860 

TAAATTAAAA GAAAAATTCA GATATATTTT AAATGTATTA TGGCATATAA TACTATAGCG 1920 

CCCTAAACAA AATAAAACAT AAATTATTAA AATAAATCAT TTATATAAAT CAATATATAT 1980 

ATCTCAAACA AAAGAAAATT TATATAAATT TTAGGCCTAC TAGCGTATCG TAGACCTAAT 2040 

AAATAATCAA CAAAACACTG GTGTGTTTAT TACAATTAAA TTAATAATAT TATATATAAG 2100 

ATTTAAAATT TTTTTAAAAA AGAAATTTGT TATAAACATA TTGGTTAAAA TCAATATAAA 2160 

TCAAAACAAA AAAATCTAAA TATTAATCTA ATAATATTCG AAATTAACAT CACTACAAAT 2220 

ATAAATAACA ACAATAAACT ATTAAAATAG TAAAATACCT AAAATTTAGC TCTCAAAAAG 2280 

ACATTCAATT GTCAAGCGAA ATTCAAGCAT TAAAAGATAC ACGAACCATT GCTAGTGCTA 2340 



wo 98/5S943 

I 

ATTCATCTAA TCCGCCCTTT 
AGAAAAACAA GTTGATAGAA 
AACTAAAAAG CTTTTGGAAA 
CATGGTGAAA GTTTTAAGGC 
TACTTAGCAC AGCAAAGTAA 
AAATTTAAAA ATTGTGCTAA 
ATATAAAAAA AACTTTCATA 
AAGATAAACT TGAAAAAGAT 
AAGCAACCGT AATTCTCTAC 
TTTACAAAGT TTTCATATAT 
TATCAAAGCA CTATTCTTGC 
AATTAATAAG CATAATGTAC 
ATCAAAGCAT TCTATTAATT 
GCTTAATAAA AAAAATTATT 
TATTGATATA AATCTTCCAA 
TTTAATATTG GtTTATATTT 
ATTTATGAAA TATAACATTA 
AGATTTTAAC ACTAATCAAA 
TAATAAAAAA AGACTAAAAT 
AAATCAAAAA GAAAGCTAAA 
CCAAACAGAA AACACACTGC 
TAATGrTAAA TATGTACAAA 
TTTCAAAGAG TTGTTCTAGC 
TAAAGCCTAT AGAAAACGAA 
GAATTTTTCA GAAATTGTAA 
CTCACTTGGA GGTGCCTTTG 
AGAAAAATTA GAGATCCCGG 
GATAAAAAAA ATCACTTCGG 
AAATAGTATA CAAACAGATG 



^ 974 

AACTCCCCTA ATTATATTAT 
AAATTACTAT TAATGAGATA 
TTCAAAAAGA TAATATTTCC 
TAAAGTTTAA TGAAAACTCT 
TTCATACAAT ATCTTAAGAA 
TATTTTATTA TCAAAAATTA 
TTAATATGAA TTTTTAGTTT 
GTCGGACATA TTACAAACAC 
CATTCATTTT GAATGCAATT 
ACTCTTTGCC AATATAAAGC 
TAAACTTAAA AAGTTCTATT 
AAGTTTACAC CAATTTTATC 
CTATAGAAAT TAAATATTTA 
AACAGATATA AAAATAATAT 
TATTTTACTA TTCTACATTT 
AATATTGGtT TATAAATTTT 
TTGTAAGCTT ATTTGTTTTT 
AAGATATGAA GTACCAATCT 
CCAATAAAAA GGGATTAACC 
. ATCAAGAAGC - AATCTCC AAA 
TTGATGATTT AAAAAATTTA 
AATTAAAAGA AGAATCTTCA 
CAGACGGAAC TGAACAGTTA 
CTTATAGTAT CTTAAATGCT 
TGGCATCAGG CCAAACAGAA 
AAGATATAGT TGATTTTCTG 
CCTTAAAAAA GCTTAAAGAT 
AAATGTTATA GAAGTTCTTA 
CAAATGCACT TAAATCTCAT 
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ATTCAAATTA TCTTGAAAAT 2400 

ATTAATGAAA ATGGTAAAAA . 2460 

CTACTTAAAA ATGAATTCAA 2520 

ACAAACTCTA CATTAAAATC 2580 

AAGATTCAAC TCTAAAAATA .2640 

ATTATTAGGA GGTTATATTA 2700 
AATAATGAAA ATCTTTGCAC ' 2760 

ATTGAAACAT GAAAACTAAA 2820 

GTAACTTTGG AAATAGGATC 2 880 

TAAAATAAAC TATAAAAGTT 2940 

AATAAGATAG ATTACACTAG 3000 

TTTTCTCAAT ATTTGTAAAT 3060 

TGTAAAAGTA TAATAATTAC 3120 

AAACCTTCTC ACAATAAAAA 3180 

GATTAAATAT ATATATTATA . 3240 

AGATTTTAAT TAAGGAGAAT 3300 

TTATTTTTAG CTTGTAATCC 3360 

AGTAAAAAAG GACTAAAATC 3420 

CCtATAGCAG AAGCAAGCTC 3480 
.AAAGAA?^,aAG ACATTAATAA . -3540 

ATAGAACAAG CTAAATCGGA 3600 

AATCAATATG GAATACTGGC 3660 

TCTGCAAACA CCGAAAGATC 3720 

ATCGATAATG ATGCCTTAAA 3780 

GGAATACTTA ACAATCTCGA 3840 

TATCCTAAAA AAGATAATCT 3900 

TCTTTGGAAA ATTTTTTAGA 3960 

TTAGACTATA AAAATAATGC 402^) 

GCAAACACAC TTTTTAATCA 4080 
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4^ ^''^ iH 

A^TCATCAGAAAA GCTAAAAAAT GACATATAT'I^Ai 



ACTGACAAAA AAAATCGAA<3"AATCAGAAAA GCTAAAAAAT GACATATATT^AATAGAAAA 4140 

CCTTTAATTT ATATGCTATA TATTGAAATT GTCATAATGC AAAGGCCTAT CTTTAATAAA 4200 

AGATAGGCCT AGCGTTATAA AAACTGCTAT TTCAACAATC AATAATTATC GAAATAGCTT 4260 

ATTACCTCAA TCACATGATA GCTTTTTAAG CTCTAACATA AAAACAGCAA TCTAACAGTG 4320 

GACATAGTTC CATAAAGCTT TACTTCAGAC AATTTTTACC TTAGTTTTTA TTTTTTTTAT 4380 

AAGAAGAAAA CTTAGAATTT AGAGTTGCAT TTTATATTTC TATCATACAA ATCGATTATA 4440 

ATTACTCATA GATCTACAAT AGTATTGATC GATTTTAGAA TTATATTTTT AATATTACAA 4500 

TTGCTATATA GTTTACTTTA TGAAAAAAAT CTATCTATTT TATGCAAAGA AGATTAGTGC 4560 

CACCCTGATT TATATGATAA TTGCCTTCCA AATTAACAAC ATATCGAATC ATTAATACTT 4 620 
TTCCCCAAAC ATTCATTTTT AAATACCCTT AATTGATAAG CTCTCTATTG TCAATGTCCA - 4680 

AGTGCTGCCC TGCTACTAAA . ATGCAATATT TATTATAAGC AACTTTCTCT ACTACTGTAT 4740 

TTTTATTATA TATTAAACAA AAAATCAAAA ACCTAATAAT ATATTATTTT AGGTTCCCCC 4800 

AAGCATTCTT GATAACAAAG TTATTTGATA TTGGTTTAAA TTCTTGTAAA TTATTTGTAC 4860 

ATACCATTTA CTTTATTATA AAAATAAAAT TTCCCTTCAA TATATTTCCC CCACTTATCT 4920 

AATTTAATTC TCTGTGTTTT TAAAAGCATT TTTGTTTTTC ATGTTTTTTT GATTTTCAAT 4980 

CATAAATAAC AATAAACTTA TTTATAATAT . TGAGAATATT ATCTAATAAA ATATTAAAGA 5040 

TGTAAAAATT AGTTACAAAA AATTGCTG 5068 
(2) INFORMATION FOR SEQ ID NO: 26: 

(i) SEQUENCE CPIARACTERISTICS : 

(A) LENGTH: 4663 base pairs 

(B) TYPE: nucleic acid 

JC)_STRANpEDNE^ . 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26: 

TTCTTTATTT TGGCATTCAA CTTTACATTT ACCTTTTTTT ACAGTTTCAA TAGGTTCTGG 60 

TGCATTTTCC ATGTTAAATC CTTATACGGC CTTTATGCTA AATTCTTCTG TGGTTAAAGA 12 0 

ATTTTTTTCA TTTTTTATTA TTTCTAATAA TTCAAGATGA TATATACCAA. ATACTTTATT 180 

GTATTCTATT TTCTTTTGGT TATTCAAATA TTTTTTGATA ATTGGCTTTA GAATTTCAAT 240 

ATTTCTTTCT TTTTTTAGTT GTTCAATAAG GATATTGAAA ATATTTTCCT 5PTAAATTTTG 300 

ATAATTTTGT TGAGAATTTT gCTTTTyycT TTCAATCGmC TTTTCTAATT TACGTTTTAT 3i50 

GTTGTTTAAA TCGyTATATT TATGmyTTTC AATAATAAAr TGGGGCTTAA ATTTGTAAyT 420 
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TTCGTATACT TTTTGTAAAT TTrTCTTTAA TTGTTCGGGr TTATATCCAT TTTGTTyGAA 480 

TTCTTTCTGA GTGTTATTTA rAATTyTyTT TAGTTTCTCT TGCTTTTCTT TAAAGCAAGA 540 

TTTATTTAAA TTTGTGTTTT TTAGCAATTT ATTTTCAACT CTTTTTATGT TTTTGATTAT 600 

TTTAATCATA GTATCTTTAT CAACATTTAA- TGTTAATAAA AAyGGAAGAA TTTCTTTACA 660 

TAAsAAGTTf CTTTTrTTGA ArTACTTTAT TACTTGATAT TTTTCTATTT CTTTAATCTT 720 

TCTTTCTTCT TTTATATTAT TTTTATTACT TAAACACTCC ACTGAATTTA CACTACyATT 780 

TTTAGAAAyA TyGTCTTTAA AATGGTTATT AACTCTAGAT TTAAATCTAG AGTTTTTTCG 840 

yTCTTyAAAG TACTTGTTGA TTTTCTGGTA ACATTCTTTT TTAGGATACT TTAGTTTATA 900 

rTTU^TTTCA GTyCCACAAT TTACACCCAT rTGTTGGTAG TAATTAGTTG TrACTTTTAr 960 

TACTTTTTCT AATTTrTAAA GATAATTTTG CATTGTTCTT AGwGTAGTGG GAGCTAGmCC 1020 

ATTTCTTTTT AGATTTTCrT TAAAGCAGTA GAGTATGT.TT TGTTGTGTGT ATTTTTTATC 1080 

TTTTTTGTTT AGAAAATCTA GCGTTGAAGT AAGAGATATT AATTTGTGTT GGTGTTTGTT 1140 

GTGGCAAGTT GGAATTTTTG TTTTATTTGG GAAATTTTGC ATTTTTTTTC TCCGTTTACA 1200 

TGTATTAGTA ATTACTAATA TAGTGCAAAA TTTTGATTTA AAAGTAAATA CTTTTCTAAA 1260 

AAAATATTAA ATTTTAATTA TTAATTTTGT TAAATTAATA TAAAAATTTG TAATTTAGTA 1320 

AAAATATAAA TTGATTTTAA TTCtAAGTTG ACTTATACTA CAAATAGCGT AGTAAAATGT 1380 

TCGCATTTTT TCTACCGTTT ATATGAATTT ACAAGAAATA AAGATATGGG CTTAACTAAG 1440 

TTCTTTAACA AGAGAATTTA GCTAAGCCCG CACTTTTTGT AAAAATTTTT TGTAAAGAAG 1500 

TTGGCAAAAA TAGTTTTTGC TATATACTTA TATTTATTAA TACATATAAA CGGAGGAAAA 1560 

AGATjSGAAAA^^T^^^ AATAA^PAATC CACAAGAAAA TATTCAAGCA GAAAT.TAAAT ,1620 

TCTTAAATGA TATGAAAACC CTAATGAAGA ACTTGCCACG TATTGACAAA AGTCTTAAAG 1680 

GGTACGGATA TAAGTATCAG GATTTCAATG ACATATTAGA AGAAATTGAA AACGTTATTG 1740 

AAAAGCATAA TTtGGATCTt AtGTTTAGGC AATTTCCAAC TTTTACACAT GATCCATATG 1800 

GTATAGTTCA TGTTATTAGG ACCACATTCT ACAGCACAAG CAGTGGGTAT AGAGAGTCAT 1860 

TTGATACCCC AATTCTTACA GAAAATTTGC AATGGAACAG TGAAAATGGT TCTAAAAATG 1920 

TAAATACATT GCCACAATTT GTTGGTTCAG CTATTACTTA TTTCAAAAGA TACGCTTTAG 1980 

TTGCATGTCT TAATATAAAA AGCGAAATGG ATACTGATGC AGCACCTATT TACAATAATT 2040 

ATGAAAACAG AAATTCTATG CCTAACAAAC AAGTTAGTGT TAATCAAAAG TAAGAACAAA 210JO 

AAAGAGAACA AAAACAAGAG ATTAATCAAA TTCAGAAAAA TAAyAyTATT CAAAACCAGA 2160 
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AAAGAGATAT TAAGCAAGA^^T^AAAAAAAG ATAGGTTTTA TTATTACAG^^TTTTTAAAG 222 0 

AAGCGTTGTC TAATATAAAA GATTGGGTAA ATAGCCCTAC AACAAAAGAT AATATAAACT 2280 

CAATTATTCA AAAAATAAGC TTTATTCAGA ATATAGACCC CAATAATGTT GATGATATCA 2340 

AGAAAATTGA ATCTGATTTA ATCTCGTATT TTGAGAAAAA TAGTGATTTT AAAAGTATAA 2400 

ACTATTGGGC GGAGATTATA AAAAACTATT TCAAGAAAAA TAATArATTA AAGGATTTAC 2460 

AAGATTTTGA AAAGTTTGTG gTgTTTAAGA GGACTGCTTA TGGTCCTAGC CCATTAATAT 2520 

TCTTTAGTGT CTTAAAAGAA TATGAACGGT TTGATGAGAT ATTTGCAGCA TAGCAAGATT 2580 

CTTACATGGT AAAGCCCCCC TATTTGGGGG CTGCTATATA TTATGAATTT TTGCACGTAC 2640 

TACTTGCAGT ATTTTCAAAG CCGTCTATGC CCCCTTTAAG GGCCTCCTGA ACGACCTGCT 2700 

. TGAAGGTATT TTTATTTTCA ACCTTATCTC CAGTACAACT GTCAAGTTCA CTCTTTATAT 2760 

GATGAAGTGC AGATTTTATT TTGCTTTCAT CATATCCTAA AAATTTATTA AATTCTCCAT 2820 

CATTGCCCAG agCTtCTTTT AACCAGTCAA GrTGTGTTTT TTGrTywTCA kwTAGCTTTT 2880 

CTCTAAGmAG kTCTTCTTTA GATTTwGGTT TTTCTTGTGT TGCTTCTTTT TGGGTTAAAT 2940 

CACGTTTTTG TCTACTTTTT GTTTGGCTAk TATTAGTATC ATTAGAATTA CAGCyGTTTA 3000 

GCATTAGTAA AAATAAACAA AATAATATGT TGATAATTTT CATTrTTATT CCTTTTTTTA 3060 

TTATTAATAT TCACTTAATC AATTATTAAT ACTAAATATT GGATAAACAA TTATTATTTG 3120 

AATTGATATG TTTTAAGTGA GGTAGTAGCT ATTTAGAAAT GAAAGCAAAT ATTAGCCCTG 3180 

CTATCATTGT GATAGACATT GCTCCCATAA TTCCCAATAC CCATTTAAGC ATTTCTGAAA 3240 

GAGACATTAA ATTCTTTTCT ACATTGTCTA TTTTAGCAGT AAGTTCATTT TTAACACTAT "3300 

CGATCTTAGC ATTAAGTTCG CTTTTAACAC TATCTATTTT GACATTTAAA TTCTTTTCTA 3360 

CAGTATCTAT CTTAGTATCT AAACCATCTA TTTTTAGATT TAAATTCTTT TCTACAGTAT 3420 

CTATCTTAGT ATCTAAACCA TCTATTTTTA GATTTAAATT CTTTTCTACA TTGTCTATTT 3480 

TAGTATTAAG TTCGCTTTTG ACACTATCTA TTTTAGAAAT AAGATTATCA AATTTTATAT 3540 

CAAATTGTTT TTCTAAATTT TCTAAATCTC TATATGTTAG CTCATTGTGA TAATATCTTT 3600 

TAGATAAATC TTGTGCTATT AATTGTTCCA TGCCCAGTCT AATAAATTCT TTATATATTT 3 660 

GTTCTTGAGT TACACTTGCA ATATTTGTTG ACACTGTTTC CATAAAATTT TCCCTTATGG 3720 

TCATATTATA TACTATTTTA GATTAATTGG CTTTAGAGAT TTTTATATGT AAAGTAGAAT 3780 

TTCTTGCAAG AAAAACCTTT TTGTAATTTA ATTTTTAAC TTCAGATATC AGTTTTAAAT 3840 

TTTTTACTGT AGATTTTTTA CAAAAACAGT ATTGCAAAAA CTCTTAGATT ACTTTTTCTT 3900 

TTCTTTGTAT ACTACAATAA CTCCAAAACC CACTAAATGG TTTAGTGATT TAACCTCAAG 3960 
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AATATTTTCG GCACCTATTT GGTTAATAAA ATTTTCTAAC CCTATCCCTA TAATTTCGAA 4020 

TAGAGTTTTG TTTTTATCTT CTTTTTTTAT AGGAAAGTTA ATGTTATGCT TATGATCATC 4080 

ACCGCCTTGA TCTAAAGCTA TTAAAGTTTT AACTTTTATA ATTTCATCTT TTTTAATTTC 4140 

ATATGAAATT AAATTACCAA TACTGATAAT AAACATAAAT AACATTAATA AATTAATTTT 4200 

TTGCACATTG TGTTCCTTAA TAAATAGAAT ATTAACAATA TTATATCTTT ATTAAgATTT 4260 

GCCCTAAAAT ATAAAATTTT ATTAAAATAT AGCAGTAATA AACGACTTTA AGAATATAAA 4320 

TGGGAATTTC TTGCAAGAAA AAcCTTTTTG TAATTTACAT TTTTAATTGA GAATATTTAT 4380 

TATAGACTTT TTCCGCTATT GGTTTTGTTT TTTTAATGTA CTCTAAATAT ATGTTGATAT 4440 

TATGTTTTAC AGCAGTTATG GaGTGTTCGT CTTTTArTGT TGATAAATCT GGaTAAGGAT 4500 

ATTCTGGaTA ATTTGGaTCA TTAACTTTAA CTTTTGTTTT aGCTAAAAAT GTTACTAGGT 4560 

ACATAACATA CTCTGAAAGT TGTGTTTCAT ATTTAGCTAA AGATTTTAGT GTTTGAATAA 4620 

TTGGAGGTTT TGGCTCTTCT GGTAGGTTAG CAATAGTGGT GCA 4663 



(2) INFORMATION FOR SEQ ID NO: 27: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4312 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27: 

CAACTTCAGT TTATATTATC AAACGACAAA TAAAACATTA AGTACAATAA CCCAATATTT 60 
CAAAAAGGAT <X;A AACTACAATT GTTGCACTTSQ^^ . . 120. 

AAATTTTTTA TACTAAAATA TAATACAAAT AATTATATTA ACAAATATCG ATTTTTATAA 180 

AAAATAAGTA AAAGTAGTTT AGTTTACCTG AGTATTTAAA TACTTTTAAT TGAGGATGTT 240 

TTATTTTAAA AAGGAGTGTA AAACTATGTC AAAAACTGTT GACGAAGTAT ATTGCTATTC 300 

TTGTGGCAAG ATTTAAAAAA GATGCTGAGA TTTGTATTTC TTGCGGGGTC AGAAATAAAC 360 

AAACCGAAAA CTACAATAAA CTTATAGTAT TTTTACTATG CTTACTTTTT GGTTATTTAG 420 

GAGTTCACAC3 ATTTTATGTA GGTAAAATAG AAACTGGGCT ATTATAATCA TACCTCTTCA 480 

CTTTTAAATA TTGTTCATAA; GCAGTGGGTC TAGGCATATT ACGATTATAC TCATGGCTCC 540 

CCTCGCCAGA ATACTTAATA TCTAGAGAAT ATAACTCCTC TATACATGAA TACAGCCAAC 600 

GAACTATACG CATAAATTTA TTATTGTTCT GCTCATTTTT TACCATAATA AACAACTTAA 660 
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TCAGGTCTTT AGATTGCTC^^ACCCTAAAT CTAGAAAGAA TTTATTAAA^^^CTCCTCAT 720 

TATAGTCACT CACTGGGmGT ACTACAyCAC GATAATTAGG ATCTTTTAAA CTAATTAAAG 780 

TCTTTTTTAT CTCAACCAAT AAACGATGTT CAGACGCATA TAATTTTAAA CTAGAAAATA 840 

TGCCTTCAGT AACAATCTCA TCGGAACCCA TATCACTACT TTCCGAATTC TCAAAAAAAG 900 

TTTGAACAGC TTGTTCCTGA TTATCAGGCA AATAACAACC CAATAAAGCC AATGyTATTA 960 

TACAAACGCC AACCAAAATC CTCATATATG CTCCTTACCT ACCTTACTAC AAAAATAATC 1020 

TGTTGTAAAT ATACAAGTTT ATCTAAGCAC TATTTTATTA . AACATTTAAA GTCCTACCAA 1080 

GATAGATTTT TCTATAACAA GTAAACATAT ACCAATTTTA CCTTTTCTCA AGAATTATTA 1140 

AATACTAAAA TATTAATTTT AGCTTTATTA TTATCTAGTG AACTGCTATT TCTAAATCAA 12 00 

AGATTATAGA AATAGCAGTT CACACAAAAT GTGCTTAAAA AATTAAAAAA TAATTTTAAC 12 60 

AAGACTAATA AAAAATTTAC TAAAGAATCC TTTTAATTAC. ATTTAAACTT GTTTGTTGTT 1320 

ATTCTAACAA GATCGATTAA AACTCCAACA TATAAAAATC CAAAT6TAAA TAGAGAAATA 1380 

GAAAGAAATA CAATTAATGG AAAAATTTTA TGAAAAAGAA CATATATATT TTGAATATAT 1440 

TTTTATATAT ACCATTATTT TATTCGTGTT TTTTGACTCC ACCAAAATCT TCAAAAATCA 1500 

ACAGTATCAA AACCGAGGTT TTGGATTTTA AGATAATTGA AGAGGGAAAT ATTATAAAAT 1560 

ATGATAAAAA GCCCATTGAA GAGCGTAATG AAAATACTTG TCTTTCTTTT AAAGAACCCG 1620 

AATTAAATGA AATAAAAGAG GGGGACGTGC TTGAATTACT TGCAGGTGGT TATGTTACAT 1680 

GGGCAAAATC TGGTGACTTA AGGGTTTTAA AAGATAAAAA TAACAATTTA ATTGAAGATC 1740 

TTAGAGAACT TAGGTACTCT TATATTTTTT CACCCATTCG ATTCAAAACT TTTTTTAGTT 1800 

ATAATTATAG CATTAATGAC AATAACTATA AAATACTCGG CAAAAAAGCA CCTATAGTTA 1860 

AGATAATAGC ATTTGAATCA ACTAAAGAGT TTGAAAAAAA ATACGAAATA AATAGTTTAA 1920 

AACTAAATTC TGAAGAATCT AATATTGATT TTGAACAAAA TAGAACTGGT TTAGCCAAAA 1980 

TTAATTTAAA AGAAACTTCA AAAGAACCTA ATTACATTTA TTCATATAAT TTTGGAGTTT 2040 

TTGACAATTC TTTAGCAGAT TATTTTAAGT TATTTTATAA AAAAAATAAC TGTAACTATA 2100 

TGCCTGCATA TCTTACTATA AAAGATAAAG AAACCGATAA ATATAAAACC TACGAAATTA 2160 

TATTAAATCT AAAGCTATTT AACGATACCA TTAAATTATT AATTAATAAG TATTCAAATT 2220 

TATCAAAAGA -AAAATTAAAA CTTTTTACTG ATGAATGATA AAAATTGAAT AAGAAAAGCA 2280 

AAGACAAAAA^rTTTATCAATT AATGTAAATA AATACAATTC AAAATTCATA AAGTTGTGTG 2340 

ACATATTCGG TATCTCAACT TGTCGATTTA AAAGTATTGA TAGTGAACTG CTATTTCTAA 2400 

ACAAAGATTA TAGAAATGGC TTCTTGTATC TTCCCATGAT AGCTTTTTAG GCCTTTTGTG 2460 



wo 98/58943 




CAAGAACCTT TAGTTTU^GA AACTATTACT 
ACCTATTTTT CAAGAATAAA TATTTTTGAT 
CTATTTAAAA TCAAAATAAA TTTATTTATC 
AAATTCTTAT TCTATGTTAT TTAGTTTTAT 
TTGATTGCTA CTATATATGT GATATAATGA 
TAGAGGTAAT ATAATGAATT TAATAATTAA 
CTTTATCTCT TGTAAATTAT ATGT^AAAGCT 
AGCTTTTGTC TATGATAAAG ATATAGCTGA 
AGATAATAGT TCTCTAGATT CTATAAAAGA 
TTTAGATGAT GCTGAAGAAA TTGGGGTAAA 
ACAAAATAAT GAAAGTAAAG TAAAAGAAAG 
AGATGATAGT GTTTTAGACA CAGCTCATTC 
TGATACTAGC AGACAACCTC AACTACTTAA 
TAAAATTATA CAAAAAGCTT CTACCTCTTT 
AAAGGAAACA AGATCAAAAC TTGATAAGAT 
TTTAAATAAT GCTAGAAAAA ATTCTAGAAC 
CCTTGATAAA GCAATTGAAA AGGCTATTAG 
TGATGCAATT GCTGCTTTAG CAAAAGCTAA 
AAATGATGCT TTAGAAGAAG CTTTAAAAGA 
TTACCATTAC CGGATAAATA ATGCTAATGA 
GGTTGCTAAG AATAAACAAA AAGAACTTAA 
TCAAGAGTTA AATGATATAT ATAAAAAATT 
AAAATATTAA AGATAAGAAG CCAGACAATA 
TATTCTTTTT CTAAACAACA CTTTATTTTC 
ATTATTTTTT AAAATATTAG ATGAATTAAC 
TTATTAATAT AGATATTATT TGCCATATAA 
TATAAATATT ATGCGATTAT GTTTAATAAA 
• TTCTCTTTTT TTATTTGAAA GTTGTTCTGG 
TGCATTAGCA TTAAAAGATC . ATC AAGAAAA 
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AAACTAGTAA TAGCAGTTAA ACTATAAAGA 2520 

ATAGATTCAG CAATACATAA CTCTAAAATA 2580 

CTCAAATTCA TCTCATTCTA ATTTTTATTT 2 640 

GATATCTATC TTAACATCTA GCTCATAATC 2700 

TAAAATATTC TAATAATATT CTATTTTAGA 2760 

AGTGATGTTG ATATCCAGTT TATTTTCTAG 2820 

TACAAATAAA TCGCAACAAG CTTTAGCTAA 2 880 

TAATAAAAGT ACAAATTCTA CTTCTAAACT 2940 

CAACAACAGA AGTGGTCGCA CATCTAGAGC 3000 

AGAAAGTAAT CAAAACAGAA ATGATCAACA 3060 

TGAAAAAAAC AATAGTTCAG GTATACAAGC 3120 

CGATGCTAGT GAAGTAGAAA ACAAGAAACA 3180 

TAAGGACTCT AGTGAAGCTA GAGAAGCTAG 3240 

AGAAGAAGCT GAGAAAGTAA ATGCAGCTTT 3300 

AAAAAGATTA GCTGATAGCG CTAAATCTTA 3360 

TAATGGTTCT ATACTAGAAA TATTGCCTAA 3420 

TAGTTATGCC TCTCTTAATG TTTGCTATAC 3480 

GAATGATTTT GAGCATGCAA AAAGAAAAGC 3540 

TATACCTCAT TTTAGGGGGT ACAATTATCT 3 600 

TGCAATGGAg^AGTGCTAAAA GTTTGCTAGA . 3660 

TGAAAATATG ACTAAGACAA ATAAGGACTT 3720 

GCAAGATATG GACTCTAGAT AAGTAAAAGT 3780 

CTTTATGAGG TTTAGCTTCT TTATTTATAA 3840 

TCTTAACTTT ATAGTTTGAC TTAAAAAATC 3900 

TTTAATATCT TTATTTTTAT ATTATAATTA 3960 

GTACATAACA AAGTTTTATT AAAAAGGAAA 4020 

AATTTTTATT ATACCTAATT TAGTATTTAG 4080 

TTTTCTATCT AAAAAATCTA TAGAACAGTT 4140 

TAAAAATACT ACTAATACTT CgTAGaTAAA 4200 
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AATAGTAAGG AAATTGAAT( 




981 

ITAAAGAC GTTACATCAT CAAAT; 




lCTTATGAT 



4260 



CCAATCTTAC AAGTAGGTTC TAAATCCCCC AAAAAAAAnC CCCnAAAATT TT 



4312 



(2) INFORMATION FOR SEQ ID NO: 28; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4305 base pairs , . 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear , * 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28: 

nAATTCGAGC TCGGTCCCCA AAAGTAAAAG CAAGCCTTGA TAAGATAAAA AGCTTACTTA 60 

GTACAGCTAA ATCTTATTTA GAGCAGACTA GAAGAGGTGT GGGATCTAGT AAgCTAACTT 120 

AGCCTTATTG CCTAGCCtAG AAGAaGCTAT TGCTAAGGTT AAGAGTAATC ATGCTTCTGC 180 
TGATACTCAT TGCAATGATG CTATTGCTGC TTTAAAAaGA GCTAAGAACG ATTTTGAGTA ' 240 

TGCACAAAGA AAAGCAGATC GGGCTTTAGA AGAGGCATTA AGTAATAGCA ATGCTTCAAG 300 

GCATGAGAGC TACTACTATG CTGGCTACCA CCAATTTATG GCTGATGCTA AAGCTTCAAT 3 60 

GAGTAGTACT AAAAGTTTGC TAGAGGTTGC TAAGAATAAG CAAAAAGAAC TTAATGAAAA 420 

TATGACTAAG ACAAATAAAG ACTTTCAAGA GTTAAATGAT ATATATAAAA AATTGCAAGA 480 

TATGGACTCT AGATAAGTAA AAGTAAAATA TTAAAGACAA GgCCAGACAA TACTTTATGA 540 

GGTTTGGCTT CTTTGTTTAT AATACTCTTT TTCTAAACAA CACTTTATTT TCTCTTAACT 600 

TTATAGTTTG -ACTTAAAAAG TCATTATTTT TTAAAtAATT ACATGAATTA CCTTTAATAT 660 

CTTTATTTTT ATATTATAAT TATTATTAAT ATAGATATTA TTTGCyATAT AAGTACATAA 720 

CAAAGTTTTA TTAAAAAGGA AATATAAATA TTATGCGATT ATGTTTAATA AAAATTTTTA 780 

TTATACCTAA TTTAGTATTT AGTTCTCTTT TTTTATTTGA AAGTTGTTCT GGTTTTCTAT 840 

CTAAAAAATC TATAGAACAG TTTGCATTAG CATTAAAAGA TCATCAAGAA AATAAAAATA 900 

CTACTAATAC TTCAGTAGAT AAAAATAGTA AGGAAATTGA ATCTCCTAAA GACGTTACAT 960 

CATCAAATAA AAAAACTTAT GATCCAATCT TACAAGTAGG TTCTAATCAA CATATGTCAG 1020 

ATGATCCTGG TGCTAATAAT AAAGAATCCC TACCAAATTC AAGTCCAGCA ATAATACAAA 1080 

ATGACTCGCA TGCTCAAAAT AATGTAAAGA TGGAAGAAAA TAAATCAGCT ACTCCAC7UVC 1140 

ATGATCCAAT TGAACAAAGT AATTTTAAAA ATAGCCTTAC TACAACAAGT AAAACTCCTG 1200 

CTATTCCTTC AGAAGAAGAA ATTAAAGCTA ACTTAGATGA ATTTGCACAA GAAGAGTATG 1260 

AGCAAACATC TCTTTCAGAA ATTAAAAATG CCACGCAAAT TGTTAATCAT GCTAATCCTG 1320 
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AAAACAAATT AAACAATACA CTCCTTGAGT TTGAAAAAGA TTATGAAACT TTATCAAACT 1380 

TGTTATTCTC TAATTTAGAC GCATCTCCTT TGAATAGAAA AATAAAGACT ATTATGCCTA 1440 

AATTACAAGA AATGCGTTCT TTTATGGAGC AAGCAACTAA TTCTTGGGTA TCTGCTAAAG 1500 

GCATGCTAGA TGAGGCTAAG GATAAACTAG CAGAATCTAT TTATAAAAGA CTATACAATG 1560 

GCAATTCATA CCGGTTCGGT GGCAGTTTTA ACGGACGTGA TATGCAACAT GCAAAAAATT 1620 

TAGCATACAG AGCTATAGAC TTTGCTTCTG CATGCATTGA ATATACACAA AAAGCTATTG 1680 

ATTATCTTCA ACAGGGAAAT TCTTGCAAAA AAGAAATAGA AAATATATTC AAGCTTTAAA 1740 

ACTTCCAGTG TAGGCTTTAG TTTCTTTAAT ATCTCTACTC ATATATAATC CCATCTTTAC 1800 

TAGAAAAGCT TATATATCGG CTTACCTAAA TTAACTATTT CACTTCCCTC TTGCCTTTAC 1860 

AAGCACTACT CTACTTCTTT CAAATTTATA GTTTGGTTTG CATTTAGCAT TCACTATTTT 1920 

TCTATTTTTA TAAATGTGAT ATATTTATTT TTTAAGAATA AAGCATAAAT ATCATCAGAT 1980 

TCTAAGAAGA GGTACTAAGA TAGATGAATT TAATTGCTAA ATTATTTATT TTATCCACTT 2040 

TAGTTTCAAT TCCAAATATC CTCTCTTGTA ACCTATATGA TAATCTTGCA GACAACGCTG 2100 

AGCAGGTTAC AGACATACTA GACAACAACA AGTCTTTTAA TACTTTAGGA AGCAGCAATG 2160 

AGAGTAGAAG TCGCAGGCCT AGAAGTACAA ATAATGCTTA TATGAAACAA AACATAGACA 2220 

AAAATCATTT AGTTGTTGCA GATATGCAAA ATGATAATAG TAGCAGCAGT CTTCCCCAAC 2280 

AAGTTAATAG TGAATCCAGT AAAGCTAATG AAGATAGTAA TATTATGAAG GAAATTGAAT 2340 

CTTCTACAGA AGAGTGCGCT AGACTAAGAA AAGATTTAGA AACTATAAAA CAAATACTTG 2400 

ATAATATAGA AAGCTTGCTT AATACAGCTA ATTCTTATTT AGAGAACGCT AGAAAAGCAC 2460 
CTAil^TCTAA. TCAA6A'C;^?^T CAAACCTTAT TGCTTAGCCT GCACCAAGCT . ATTGCTAAGG . ^ .2520 

TTAAGAGTAG TCATACTTCT TTTATCATTT GTTATAATGA TGCATTTAAT TCCCTGGGAA- 2580 

TAGCTGATAC TGCCTTTAAA GATGCAAAGA GAAAGGCAGT TGAGGCATAA AATGCTTCAA 2640 

AGGAAAATTA TGAATGGTAT AACGGTCATT ATCATTCTTT TATAAATGAC GCTAAAGATG 2700 

CAATGGAGAG GGCTAAAAGG ATGCTAGATA ACGCTAAGCA TAAACAAGAA TATCTTAATT 2760 

CTAATATGTA TCAGGCAAAT GCAGACTTTG AAGAGCTAAA TAAAGCATAT GAAGCTGCTT 2820 

ATTAAATAAT ACTAATCTTA GATAGCTCAG GTTTAAAGAA AAAAGCTCTA TGCTATAAGC 2880 

TTAACATATA ACTCATATTC TTGATTACTA ATAATAAATG TAATATAATG ATATTGTATT 2940 

ACAATAATAC TCTATTTTTG CATAAAGTTA GCACAATGT^ TTTAATGATT AAAGTATTAA 300^ 

TATTCAGTTT ATTTTTAAGC TTTATCTCTT GCAAGCTATA TGAAGCTGTA GATAAATCTC 3060 
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TTATAAAAGA CAACAAAAGA AGTGGTCGTA AAGCTAGAAG TATTA6TTAT"AAGGAAGTAA 3120 

ATAATCAAGA ACAAAATAAT GAAAAGAACC TAAAAGAAGC AAAAGAAAGT AAAAAAAACA 3180 

ATAATTTAGG TATACAAAAA GATGGTATTG TAAACACAAA CCCTTCCGTT GCTAGCGATG 3240, 

CTAGTGAAAA ACATACTAAT AGACAACCTC AACAAGTTAA TAATAACTCT AGGGAAACTA 3300 

GTGAAGCTAG AAACATTATA CAAGAAATTT ATACCTCTTT AGAAGAAGTT AATAAAATAA 3360 

CTACAGATTT AGAAACAATA AAGTCAAGAC TTAATAATAT AAAAAGTAAA GTTGACAATG 3420 

CTAGTTCTTT TTTAAATAAT GCTAGAAAAT CTAATAAAGC TAACCCAACC TTATTGCCTA 3480 

AACTTGATCA AGCTATTCGC AAAGTTAGTA GCAGCCATGC TTATGCTAAC TCTAATTATT 3540 

CAGATGCAGT AAGTGCCTTA AAAAGTTCTA AGCACGATTT TGAGTATGCA AATAGAAAAG 3600 

CAGAAGATGC TTTACAAGAA GCGTTAAATA ATAGCAATAC TCAAGGTTAC CAATATGCTC 3660 

GATACCACTA TTATATGAAT GATGCTAAAG AAGCAATGGG CAGGGCTAAA GTTAGCCTTA 3720 

AGACTGCTAA GCAGAAACAA GAAAAACTTA AAGACAAGAT GGATCAAGCA AATAAAGAGT 3780 

TTGAAGAGTT AAATAAAGCA CATGAAGCTG CTTTAAGTAG TAGAGAATCT TAGCTGGTGT 3840 

AGCTTCAAAG AAGACATGAC ACTTACTTAT AAATAAGGAA GCTTTTGGAT TTTAACAAAA 3900 

ATAGTCTGGC TTTTTTGCAC ATATAAAACA ACTCCATTAT TTCTAAGATA AATATTTTAA 3960 

GCTCCCTGGT AAAGTAATTC ATTTATCCTA GATTTACTCT TCCACTTCTA TACGTCCCGT 4020 

CCTGCTTAAT CATTAATTTT TAAAATTAAA TGTTTCTTTC TAGTTACGCA CTATATTGTT 4080 

ACTATAACAA AAATTGAATC TTAAAAATTA ACATATTACT TTAAAAAAGT ATACTTATAG 4140 

GAGATGCTTA TAAAGCTTAA CAAACTTATT TTTACCAATA TATATATCTA ATATCTCTTA 4200 

TACTTAGTTG CTCAATATCT AAAGATTTAA GTGATAAGCT CTCTTCACTA AAATCTAATG 4260 

ATTTTTTTAA TTCAGACACT TTAGTTTATG ATTCTAGCAA TTATG 4305 
(2) INFORMATION FOR SEQ ID NO: 29: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4293 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29: 

CGATAGCTTT AATAAGcAAG CTCAATTACA ACAwTTAAaC CCAGGTGTTT CACAAAAACA 60 

AGAwATAGAT AAAAAAACAT AGAAAAAAGA AGCCTAGACA ATTCTTCACA AGAAAAAGAA 120 

CTCACAAACC CTGCTTATTC AACACAAGAA CATACAAAAA GTGCTACAAA CTTAGACTCA 180 
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AAAAAAGATG CTCTTATTAA AGAAACTCTT GAAGCTATAA AGGAAAAAAT TAAAGAAGAA 240 

AAGAAAAGCT ATTCTAGAAG AGCAGCAAAG ACAGAAACAA CAAGAGCTTG ATAAGATTAA 300 

AGCACAATAT GAGGAAGAGA AGAGAAAGAG AGAAGAAGAG AGGAGAAGAG AGGAGAAAGA 360 

GAAAAGAAAG CAAGACTTCA AAAATTCATG CAAACTACTT CTGACTTAAC TAATCTTGTT . 420 

AAGATGGCTG GGCTTGAGGC TTATAGCATT TCCCATAAAT TAAAAGATCT TGAAAAAGGT 480 

ATTGAAAATT ATGAAGACAA CAATAATTCT ACTAAAGACA CACTAAACCA ATCTCTTAAA 540 

GATGTTATTT aTGAGATTAC AAAGCTTAGT AGTCTTATAG AAGCAAAAGA TAAGATTGAT 600 

CAGCGTAAGA AATTGGGTTA TCAGACAGAA CAAGAGTTTG ATGCTAAATT TATAAACTTA 660 

AAGAACATCA AAGATAAGCT AAAGACTTTA TGTGGTAAGG CTAAAGGCCA TCTTGGTAGC 720 

AATCTTTCTA GCGTTACTAT TGATGGGATT ACTAAAGAGA AGGTAGCTCm AGCTTATCTT 7 80 

ATCATTAAAC TAATACACAA AACATTAATT TATATGAATG ATGATAGTAA AGGTAGCCTT 840 

GCTACTATAC TTAATGACTT AGAAAAGGAT GCCAAATCAA TATAACTAGC ACAACAATAT 900 

CTTCTTATTT TAAAAAAGCC TAAGTACTTA TATCTTAGGC TTTTTTAAAA ATTATCTTGC 960 

CTCTTAGACC ATTCTTGATA ATAATAATAC TGTTAAGAAT AAATTAATGC TAAAATGGAT 1020 

AAGTACACTT ACACTAATTA CTATTTTTGC AGTAAATATA AAAACATAGA ATAAAAATTC 1080 

TTATAACTAA AAGAGTATAA TCTTCTTCAA GAGAAATATA TTATCAAGAA ATTAAATAGA 1140 

CCTTAAAATT ATTTTTTCTA TATATTCAAA ATTACTTTAA CTATAATATT ACCTATAGAG 1200 

AAAATCGTAT GGTAGTGGAC GAATGGTTTT TCCTAAAAAT AAAGAAAAAT AGTAAAAATG 12 60 

GAAGAAAAGA AAACAAAAAA AAGATATAAT TCTGTATAAA AAAATTCTTT AAGAATTTTT 1320 

CCATTTTTTA GAAAATGGTT TTGTATAATA GAAATATTAT AT-TTTTTTCT- GTATGTCTTG 1380 

TAATACCATT AATAATATTG ATCAAAATAT TAAAACTTTC TATTGACCAT ATTTCTGATT 1440 

GAACTGGAAT TATAATATAG TTTGCAGTAT TTAAAGCGCT CTTTAAi\AGA AAATTTTGAA 1500 

TCGGAGAAAA TGTTTACCAA AATATAATCA AAATAGCAAT TGTATTTGGA AAGAGATATA 1560 

AATATTCTAC ATATTTATTT TTCATAAAAA CTTTTTTTTA AGATAAGATT AATACCAATG 1620 

CTATGAGATT TATTTTTATC ATTTTAATTT TCTTTTAATA AAAAAACTTA ATAAGTTATC 1680 

AACTTAGGTC AACCACAGTA AAACAATTAA AATGACATTT AAAAAGATTG AAATTTAGTA 1740 

AACAAAAAAA AGCCCTTATG GGCATCCTTT TCCGGTTTAG GATAAAGAGA AATCTTTATC 1800 

TTATACATTA AGAATAATAT ATTATAAAAA AATAATCAAT GGATTATTTT TTTTATTCTT l&SO 

CTTTATTTTC ATACTCCATC ACAAGACTAA ACAAGATATC CCTTCTATCC TTAATAATTT 1920 
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TTTCCAAAAT AAAAACTGCT CTTTTGGTAT CTCTTATGCA AAAAGAATAA ACTTCCTTAT 1980 

CTTTTATTAA AAATTTAACA GGGGGCATAC ATGAATTATC ACAATCTTTT TTTCTATCTT 2040 

TTTTATGTTC AGATGATTCT AATTGATTTT TCAATATTTT TCTGTATACA GATGAAAAAC 2100 

CCkGTTTTTT AATCTCCTCA ACAGAAATAT TTCCCTCTAA GACTTCTTGA TAAATTTTTA 2160 
TATATATATA CGCTTGGCTT TTATTAATTA CATAAGACTT AATAAACTGT TCGAAACTGT . 2220 

CGAACCCGTC ATATTTATAA AGATTTTTTT GTTTGATTTC GTATAAAATT TTCATTCTTT • 2280 

GAAATTTACT ATCAATATCT AATTTTAAAT TGTATGCTAG CTATTCTTTT AATTCATTGT 2340 

AATTTTTTAA TTCCCTGTTC TGATTGATAT CCATTTCTTC TATTTGAGTT TCTACCCTTT 2400 

TATACAAAAT TATGTCTTTT TTGTTTTCTT TTTTTTCCAT TTTTACTCCC TTTCTTTATT 2460 

TTTAGAAAAA GACCATTCGT ACACTAACAC GATTTTCTCT ATAAGATAGA TTACGGTTAA 2520 

AACAATTTTC ATTATAAAGA AAAAATATTT TTCAAAGTTT CTTTAATTTC TTGATAATAT 2580 

ATTTCTCTTG' AAGAAGGTTC GAGTCTTTTA GTTATAAGAA CTTTTATACT ATTATAAAAA 2640 

TGTATCTTGC CCTTGATATA TTCTTTGTAT TCTTTATGAA TCAGATTTTC TACTTCTTTA 2700 

AGAATATTTC TATTTTTTAT AAATTGGTTT TCTACAATAG AAATATTATA TTTTTTTTCT 2760 

CTATGTTTTG TAATGCCATT AATAATATTG ATCAAAATAT TAAAACTTTC TATTGACCAT 2820 

ATTTCTGATT GAACTGGAAT TATAATATAA TTTGAAGTAT TTAAAGCACT CTTTAAAAGC 2880 

AAATTTGAAC CTGGAGAAGT GTCTAACAAA ATATAATCAA AATCGCAATT TATTATATTT 2940 

CTATTTAAAT AATATTCCAA GAAAGTTTCT TGATCGGTTT CTGTATTAAA TTTTTCTAAC 3000 

ATAGGATGAG AAGGAATTAT ATACATATAA TCATTAATTT TATTTAAGTA TTTTTTAAAA 3060 

TAGAAATCTC CTTTTAACAT ACTATACACA TTATATGTTT CGGCGTCAGG AATATACTTG 3120 

GTAAAATATG ATGTTAAAGA ATTCTGTGGA TCCAAATCAA TTAGTAATAT TTTTTTACCC 3180 

AATTCCTTCA ACAAATAAGA AAAAAGTATA GAAAGTGTGC TTTTTCCAAC TCCTCCTTTA 3240 

ACTGATGTGA GTGCTATAAT ATCTGGTTTT TTAATATCCA TTTATCTAAA ATTCCTCCAT 3300 

TTGTTAGTTT TTTGTTGTAA AATTTATATA* CTTTTCTTTC CATTTTTTTT AAATGTTTTA 3360 

AACTATACTT GTAGTATTTG GTGTCTTCTT TTTGTCTTTT TCTTAGCAAG GTTCTTAGAG 3 420 

ATAATAAGTA ACACTTAATA GATCCGGTTT TAAATATAAA TTCTATATAA TATAGTTTTT 3480 

TTATTGCGTA ATTTCTATTT TTTCCTATTT TATGAAGAAA TGGTTTTTCA AGTCGATCGT 3540 

ATCCATACCT TATTCCTAAA AATTTATTTT TTCCTTCTAT TGGGAAAAGA TTGAAAGAAT 3600 

ACTTATCTTT ACTATTAAAT TTTTTAAATT CTAGTTTCAG TCTTTGTTTT TTGCAGTTAT 3 660 

TTCTAAAATT AACTAGATGG TAGAATATTT TTGTGTAATA TATTTTCTTT CCATTCTTTT 3720 
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CTTCTATTTT GTTAAAAATA TTTTTTATTG GATTTTCATC AATATTCATT AACGCTTTCT 37 80 

TTTGTTTTAG TTTTCTAAAA ATTGT^TTCA AATCTTTTTC CTTATTACAT TAATCAAATA 3840 

ATTGTTTAAT GTTTTATTAC TTGTAATGTA AATATGTAGC TTGTTTAAAG TAAAATAATT 3900 

AAAGTTCTAG TTGTAAAAAA GTATTGTGGA TAAGAAAATG GATTTCGTCA ATTTACAAAA 3960 

GGTATATTAA CTGATTTAGA. TAAAAGTCAA AAATATTGTT TTGATTTATA TCAGAATTGG 4020 

TAGATTGGkA TGTTTTAAAG TAAGTATTTA GAATAGCTTT TACTATTAAG CTTGCrkACA 4080 

AAATGGTGTT GTCAGCTTTA TTCCAATCTT AATTTCATTT TATCAAATCA AATTAAGATT 4140 

GGAATCAAAT GAAACAAAAA AAGTGAATAA GAATTCATCA AAAGAAATTC GCAAATATGT 4200 

TAAAGGATTA CTTAATATTG TTAAAAATAT TGTGCCTGTT ACAACTAAAA GGTTGAAGAA 4260 

CTATATTTAA AATTGTGCAG GGTATCTAAT GAA 4293 



( 2 ) INFORMATION FOR SEQ ID NO : 30: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4228 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30: 

TTGGAAAGGG AAAnGCAAAT TCTCAACAAn ATTATCAAAA TTTAAnGGAA AATATTTTCA 60 

- ATATCCTTAT TGAACAACTA AAAAAAGAnA CAAATATTGA AATTCTAAAG CCATTATCAA 120 

AAAATATTTG AATAACCAAA AGAAAATAGA ATACAATAAA GTATTTGGTA TATATCATCT 180 

TGAATTATCA GAJbXTAJVTAA-AAAATGAAAA-AAATTCTTTA ACCACAGAAG AATTTAGGAT - 240- 

AAAGGnCCGT ATGAGGATTT AACATGGAAA ATGCmCCmGA mCCTATTGAA aCTGTAAAAA 300 

aGGGTAAATG TAAGGTTGAA TGCCAAAATA AAGAACGyTT TATTTTGATT GAAAAAGAAA 360 

ATGGTAAAGC AATGTACCAT ACAAAAATAA TGATGGAyAT TTATAAATTT GGA6TTTATG 420 

AGAAAAAACA CGAATTTAGA TTATCATTGA GGGCCTTATT TAAyGGGGAA AGAATTGTTG 480 

AAGAAACTCA TTTrTACCCA ATTAAAGAAG GAGATAAGTT yATTGGTATT TTTTATGGCT 540 

ACAGAAAACC AATTAAAAAG CCGTTAATAA AGTATCAAAT AAAyGGGACT ArAAAAGCAT 600 

ATGCATTAGC AAGGGCATAT TATATGGAAT TTAGATTTAA AGCAGGAAGT GTTTTTTGCT 660 

ATTTyAAgGG inTaTATCGAT TATTAGATAA AAAAAGAACA AATAAlKTACT ACAACAAAGT 720 

TTTATTTAGT ATGTTTACAG ATTTAGAACA ACAAGTATAT AAATTTTATG GGAAaAAATA 780 
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CCCGGAGCAA GGACCGTTAA TAAAATGGAT ACTAAAAAAC CTAAAATAAT AACAATAGCG 840 

TCAATTAAGG GCGGTGTTGG CAAAAGCACA AGTGCAATAA TTTTAGCAAC GCTATTATCA 900 

AAAGACAACA AAGTACTTTT AATTGATATG GATACACAGG CTTCAGTTAC TAGTTATTTT 960 

TATAAAACAT TAGTAGAAAG TGAATTTGAT TTACTTGAAA T^^AATATATA TGAAGTTTTA 1020 

AAAGGAAATC AATTAATAAA TGATGCAATT ATCAATGTTG ATCATAATTT TGATTTGTTG 1080 

CCAAGTTACT TAAGCTTGCA CACTTTTAGT GAAGAGCCCT TGCCTTATAA GGAACATAGG 1140 

TTAAAGGATA GCTTTAAATA TTTAAAATTT AAATATAATT TTATTATACT TGATACTAAT 1200 

CCCCATTTAG ATTCTACGTT ATCCAATGCT TTAGTTGTTA GTAAACATGT TATAGTTCCA 1260 

ATGACTGCAG AAAAGTGGAC TATTGAGAGT TTGCAACTAT TAGAGTTTTT TACGGATAAA 1320 

TTAAAGTTAA AACCCAAAGT ATTTTTATTT GTAACAAAAT TTAAAAAAAA TAAAACTCAT 1380 

.AAAGATTTAT TAGAAATGTT GCAAAAAAAA GAAAAGTTTT TGGGGATAAT ATCAGAACGT 1440 

GAGGATTTAA ATAGGAGAAT AGCAAAAAAT GATAGATTTG ATTTAGATAA AGATTATATA 1500 

AAGGAGTATG TAAACGTTTT AAATAATTTT ATTTTGAAAA TATGAAATTT GTCCGATAGT 1560 

TGGATCAATT TTTTTAACAA AAAGGATAGG AGATTAATTA TGGACGTGGG AATAAAAATA 1620 

AACGATAGGG TAATATCAAA AAAGGAAATA AAAAAAGAAT TAAGCAATAA AGATGAAATA 1680 

TTAAAGCATT ATAATTTGTT GAAGGAGCGC TTGAAATCTA ATTTTGAAAA AGAAATCTAT 1740 

AATAAGATAG AGAGTATGAA AATTTTAAAA GAAATAAAAG ATAATGAATA CTATAAACTT 1800 

GATGGTTATA AAAGTTTTGA TGCTTTTATA AAAGATTATA AGTTAGCCAA AAGTCAAACT 1860 

TATGAATATT TGAAGATAGC ATCAGCTATA GAAAATGGCG TAATAGAAGA ACTTTTTTTA 1920 

TTAGAAAATG GAATTAAAGA AACTATAATC TTTTTAAGAA ATAGTAATTC AGATACGGTT 1980 

AAAAAATCAA AACAAAATCC AATAAAACCA TTAAGATTTC AACTTAAAAG CaAAGAAAGT 2040 

TATGATTTTT ACAAAAGTAA TGCTAAATTC ACGGGATTTT TATTAGATGA ACTTTTTGAA 2100 

AGTCAAAAAG ATTTGATTAA TAAATTCTTA AGAAGATATA AGCAATTAAA AGGATAGTAA 2160 

AGGTATTTTA TGACTAATTT AGCGTACAAA ACGTATAACA TAGAAAGCAT AAAAAATGAG 2220 

TTTTTAAACA TAGGATTTAG TGAAGAGGCA ATAGATTTTG TTTTGCTTCA TAATGAAAAT 2280 

TACAGCTTTG AGGTTTTAAA AGAAAAATTG ATTAATGTAG AGAAGAATTT GCAAAAAGAT 2340 

ATATCTAGTT TGGACATTAA GATAGATACT GTAGMlAAGA ATTTACAAAA GGATATATCT 2400 

AATTTAGACA TTAAGATTGA TGCCGTGGAA AAOAATTTAC AAAAGGATAT ATCTAATTTA 2460 

GACATCAAGA TTGATAATGT AGAAAAGAAT TTGAAAAAAG ATATATCTAG TTTAGATACT 2520 

AAGATTGATG TTGTAGAGAA GAATTTAAAT CTAAAAATAG ATTTTGTAGA AAAGAGTTTA 2580 
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AATGCCAAAA TAGATAGTTT AGACGTTAAA ATAGATAATG TAAATAATAA AGTAGATTAT 2640 

ATTAAAAGTG AACTTATTGc CAAGATAGAT AGTGTAGAAA AAGGGTTAAA CGAAAAACTT 2700 

AATACaGGAA ATAGGCTAAT ACATTTTATG ATATTAACAG CAGCGATTCT AGGCCCAGTT 2760 

TTAAATGCCC TATTTATGAG ATATTTACAA TATATCAAAT AATGATGTAA TGCATAATTT 2820 

GCTTTTTTCA AATAGTTTAT TATCAATTAA AGCfTATTTA AGCTTTTAAA TAAAGTAACT 2880 

TAAATAAGTT CTTTTATTTT AATAAATACA AATTGATTTT AATTCTAAAT TGAACTGAAT 2940 

TTAATTGTTT AGTGAGTTCA CCTAAAATAA ATTAAGCTAA GCCCGCGGCT TTATTAAGCT 3000 

CTTTAACATG AGAATTTAAT AAAGCTTTTA TTTATTATAA TAATTTCTGT AAAAAGCCTG 3060 

ACAAAAATAG TTTTTGTTAT ACATATGTAT ATGTATAGCT AAAAAAATAT ATTGCTATCA 3120 

AAAAAATCCA ATTAAGTTGG GTTTAGCTAA GTTCTTTAAC AAGAGAATTT ArmTAAGCCC 3180 

tATTTTTTTG TAAAATTTTT TGTAAAAAAG TTGGCAAAAA TAGTTTTTGC TATATACTTA 3240 

TTTtTAtAAA TAAcaaGGAG kAAAAAGATG GAaAATCTTT CAAACAATAA TAATCCACAA 3300 

GAAAATATTC AAGGAGAGCT CAAAATGATA AGTGTTAATC AACAAAGTTT TACTGGTTGT 3360 

GAAATAATTG AGGAAAAATC TTCTCCCATT AAAGAAAAAA GTAAATTAAG TAAGATAGGT 3420 

AAGAAATTGC CAGGAATAAG CAGTCAAGAA TGTTTTAGAT TTAATCGAAA TATTGATTTT 3480 

AGTGTGCAAA GAAACAAsTT aGATAAATAC GGTGCTAGTG AAGTAGGCAA TATTCTTGTT 3540 

GGAGGTGCTG GrCTlcAAAGA TTTAATGATA AACAGAGTGC TTAAATATTT TrrwATGAGy 3600 

"CTACCTTTTG AAGAGAATTT rTATATGCTC AAGGGCAAAG ArTTAGAGAA TTTAGGATTT 3660 

AGAGArTTTG TTAAAGCACA yrGTGATAAT ATTrATrTTT TGTATAAAAA CAAATATGCC 3720 

AAyGGwGT^ ATAAGTATAA yTATTTCAAA AAAATGGGyA GTTCA-T.AAAC TTTAGTGGGC 3780 

TCAACAATTG ATGGCTGGTT TATTAATAAT AATGGCGATT TAGAACTATT AGAGATTAAA 3840 

AGTAGCGACT CTCATTATAT GAGTAGTGCT ATTGCTGAGT ACAATAAAAA TGGCAATTTT 3900 

TTAAGCAGTA AATATTTTTT CAAATATTAT GTACAAGCAC AAATGCAGCT AGCATGCACT 3960 

GGGCTTGAGT ATTGTAATTT GTTCTTTTTA ATAGATGCTG CACCAATTAA CTGTAAGATT 4020 

AAAAGAGATG AGGCCTTAAT ATCAAAAGTG TTTGAATTTG TTAATAAATG TGAATTAGAA 4080 

ATTATAAATT TAAAAAAAGA TATTTATAGT AACTATAGAG ACGATTACTT AATGGCACAT 4140 

AATTTTAATG AGGATACGTT TATAAAACTT GTTGAAGATT TAGTAGAAAG GAGTGATTTT 4200 

TATAGTTCTG GAGTTGAGTT TGATTGGG 4228 
(2) INFORMATION FOR SEQ ID NO: 31: 
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(i) SEQUENCE a 




lGTERISTICS: 



989 




(A) LENGTH: 4137 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : . double 

(D) TOPOLOGY: linear 

• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31: 

TTATTTTGAA TTAAAACTAA TGTTTAGTAA TTCAAATATA TAAGGAGAGC ACATTTTGAA . • 60 

AAACCTAAAT TAAATATTAT TAAGCTTAAC TTTATTACAG CAATACTGAA TTCAATTTTC 120 

ATATCATTTT TACCTATTGG AAAGGTCGAT CCAAAACCCG ATATCAATAC TAATCCAGAA 180 

AATATCCAAA ATTAAAGTTT AGAGAAGCTT TTCGCATAAA TATTTTATAA TTTTTAGGAT 240 

TATATCGGCA ACTATGTTAA ATATTACTCG AATGGCTGTA CTTTGATATT AAAATCTGTT 300 

ATTTGTGGAG TTGGTATTTC TGATTTTTAA ATAATTTCAG GAGTAACTAT TTCTTTGAAA 360 

ATTTCAGGAA TTGTTGTTTT AGGAATGATC ACTTTTTCAG TAATTTCAGA AATAATTTCA 420 

CCAAGGCAAT TTTATTCTTT GCAAGAATTT TGTTCACAAT TGTACAACAT AATCAAAAAA 480 

TTAAAAAAGT AAAATGCAGT ATGAAAACTG ATAGTGAGAT TTCTTATTCA AATAGGAACA 540 

TCTACAATTC TATCCCAAAA GTAAAATAGG AAAGAGTTTG TTAGAAAGAA AACCGTATTA 600 

ATTTCTTGGT TAAGTTATGT AATAGTAATG TATTGTTATT AATTTATTAT ATAAAATTTA 660 

GGCATAAAAA ATAGGAGGTA TCATCCAAGC ACACTTTAGG TGCTAATGAG AAAATAAAAA 720 

TTTTTTAAGT GGAGAATAAA GAGTAATCTT TGGGCAAATC GAACAAAGAT TGCTTTACTG 780 

TCTTATTTAA CTATAGTAAG TTTATCTCTA AAATAAGATT ATCCAAGCTT ATTTTAAGCT 840 

TTTATTCATA TTTCTCAGCA AAATCAATTT AGAAATCTTT TAATTTTTAA TTCTTGTATA 900 

ATGCTTACAA AAAATCATAA GTATAGAATC CGCACAAATA CCAAATGTTT TTTTATTCAT 960 

CATAACTTGA TCCGTAAATT TACGAACACC AATAATACGG TATCGTAAAA TAAATAACTT 1020 

TATCAGCCTC AATAATAACT AAGAATACAA ACTTGGCATT GCTAGTAAAT TTTAGCAAGA 1080 

TGCTAAAGGA TGATGTGCCT GGTTATAAGG ACAACCAACA ATACTTTAGA GAATGCAATT 1140 

GTAAAGTATA AGGAAGCCAT AAGTAAGACT ATTTGGGGCT AAGAGTCAAA TTAAAATAAA 1200 

GACAGAAAAC AATAAGTAAG AGAAAAAGAA TGAAAGCTTA ACTCATTTAA GAATAGTTAG 1260 

AGGTGTTCTT TCTGTTGTTA AAAAACCACT GAAACAGCTT TGCCTAGCTT GCGCTGATTT 1320 

TATTGCTACT QETGCCAGTC TATCTTGTAG TGAATTTAGG CAAACTGCTG AAGATTTTAG 1380 

TGTTTGCTGC TAAGGAGTAT GCTAATGGAA AAGGAAAAAT AATGATTTTG ATGTTATTAG 1440 

GTGCTATTTC TAGTATGGCC TATAATGAAT TTGAATAGGA GGTTTCAAAG AGTAAAGACT 1500 
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TTTGCTAATA ATGAAGGGGG CAAATTAAAC AAGATGACTG CTACTATTGA TAAGTTATGT 1560 

GCTGTTTATA AAAAAGTTAT ATCTTAAATA CCTTAAGTTT TTGGCCAACT CTTTTCTCTC 1620 

TTTAAAACAC TTTGCCTCTA TGCTTGCTTT ATAATAAAAT AATACTTGGA TAATGAATAA 1680 

CTAAAAAAAT ^AAGGAGGTAT TAATGAAAAG GAAAAGCAAT ATATGTATTT CACTTCTAGT 174.0 

CACAATATTA TTTGTGTCTT GCAAGTTTTT TGGAAATAAA AGCGCAAGTA AAGAAAAAGA 1800 

AGAAACTTCT TTTTCTGATA CTGCTAGCAA GATTAGTAAG TCGGGAACAG CTGCTTCTTC 1860 

AGACAAACAA GAAAAAAATA CAAGTGATGT TACAGGTGAC GCCAAAAAGC ATACTAGTAG 1920 

CCCTTACATG CTTGCTGATG CCCTTATTGT TAGTGATACT ACTAATAGAG ATAGAGATAA 1980 

GCAAGAAAAT AAAGATAAAT TAAATGAAGA AGATAAAAAA AAGCTTAATG CTTTTTTTAG 2040 

CACAACTAAA ACATATCAAT CTAGCCTAGA TTCCATTTAT TUVCAAATATA CAGGCTATTA 2100 

TAATACCATT GATACCTATG GCAGCTGTGA TACGTATCGC ATTGAGTGTT TTAGTGTAGG 2160 

ACCTTCTGAA AAACGTAAAC AAGCTCTTGC TGATCTAGAG AAGTTAAAAC TAGACGAAAA 2220 

GTACACTCAG CTTAGCACAA TGTTAAAGAG TGCTGTGCCT AGTTATTACA AAAAAAATTT 2280 

AGATGATTCT ATTGCACAGT ATAAGGAAGC CATAT^GCAG GCTATTGAAG CTGAAAGTAA 2340 

AATAGAGACA GTAAAAGACT ATGCAACAGC TCAAAGTGCT GCCGATGACG AAAAGAAAAG 2400 

AAATATAGAT AATTTAAAAA TAGTTAGAGA TGTTCTTCTT ATTATTAAAA AAACTATTGA 2460 

GAAAGCCAGC CGATCTTATG CTGATGCTTT TGCTATTGCA ACATCTAGCT TATCTTGTAG 2520 

CGAATTTAAG CAAGCTGTTA AAGAGTTTAA TGATGCTGCT AAACAATATG CTAATGGAAA 2580 

TAAAGGAGAC AATGCTGTCA ATGTTATTGT AGGCACTATT TCTAGTATGC CTTATGTCAA 2640 

ATTTAAAGAT GAGTTTGCAA GAGCiy\AAAT GTT-TGCTCGT -?i?iTTATAGAG GAGACGAGGT 2700 

AGACAAGATG ATAAGAGCTA TCGACAAGCT GTGTGATGTT TATAAAAAAG TTGCGCTTTA 2760 

GAATAAAATA AAATTAGGGT TTTACACCAA AAACTATGTT CTGTAATATT CAATATAATT 2820 

TTCTTTATCT ATGATAGAAG AGTCTTTAAA CAAAACATTA ATCTTATAAA ATTCTTCTCT 2880 

CCTCTCACAT ACTTTCACAT CCTATTTAAA ATTAATACTA ATGCCTCCCA AGAAGCCCAT 2940 

TATTGCCATA TGAATTTAAC TAAAATACTA TCGAAAAAGA AGATATGAGC TACAAAACTC 3000 

TTTAAAAAGC CCCATATCCA AACTAATCAA TTTAATCACT TTATGTCTGT CTTACTTAAT 3060 

AAATCACTAG AATCAACTTA TCAAAAGTAC TTTCTTACCC CCCCCAATCA TCGTAGTTAT 3120 

CTTTTTAAAT CATATATGAT ATATGTATTA TTATCAGCTT ATCTTCCCTA TATATTAGGT 31-80 

AAAAAATAGA AACAAACAAC CGTGCATTTG CGACTCAATA AAACACCTAT CAAAAACCAA 3240 
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TATTCTACTT TCATTATACA GAATAAAGCA ATATAATATA 
AAATTTATTT AAACTTAATA AATAAATTAA GGGGAGAATA 
AATACGTTTA TTTTAATATT AGTAACAACA ATGTTTGTAT 
GATGATACAA ATAAAAAAAA TACATCTCTA AATGGTGATA 
GGTTCAGTCA TTTTAGAACA AGACGGAAAC AAAAAAGGTG 
GCTTTGGATC AAGTTACAGA ACATGCTAAT AGTGAACTTA 
TCTAGTATTA GTAAATACAA CCAAGAAAAT ACTACTGGCA 
GATAAGCTTA AGGCTTTTTT TGTAAAAACT ATAACATATC 
TATAACAAAT ATACACGCTC TTATAATACC ATTGCAACTT 
AATAGTATTG GATGTTTTAG CGAGGGCCCT TCTGCAAGGC 
CTAGAAAAAA ATAAACTAGA TGAAGAGTAT ACTAAACTTA 
ACACAAGATT ATTGCCCCAA AGCTCTAGAC AATGCAATTG 
ACAATAGCTA AAGAAGCTGA AGATAAAATA AAAAAAATAA 
GGCAATAATA ATGAGGAAAG AAAAGAAAAT GTAGATAACT 
CTTTCTATTT CCGAAAAGAC CATAGAAACA GCTAGTGTGG 
(2) INFORMATION FOR SEQ ID NO: 32: 

( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3760 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



TTTAATATAT 
AAAAAAGAAT 
CATGCAAATT 
CTAGAGAGAT 
ATACTACTGC 
TGCTTAATGA 
AATTAACCGA 
AAGGGATACT 
ATTCTGGTTG 
GTAGTCAAGC 
ACCAAATGCT 
AGGAATACAA 
CAAGCTTTAC 
TAAAAAAAGT 
CTTATGCCAA 



ATTATCGCTT 
GATAAAAGGC 
CTATGGAAGT 
TGACAATATA 
TAGTAAAGTT 
TGACCCTGAT 
AGAAGATATG 
CAATTCTATT 
TGCCAATTAT 
CCTTAACGAC 
AAAGGAGACT 
GAGGGCTATA 
AATAGATGAA 
TAACAATATT 
TGCTTTT 



3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4137 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32: 
ACTTTTTCAT TTTTGAAGCT TTATATATTt TTATaCAGTG ATTAATTCTA 
TATTTyaTAA AATTTTTGAT AAATCAATAA TCTACAGCCA ATATTAAAAT 
TAACAAATCT ACAAGTAGAT AAGATGCCTT CCAAATCTTT TTTACTCGTA 
AAAAAAAAGA ATAAATTAAA TGCAATTAAT AATTAAAATT ATAATAAAAA 
ATAATATCAA AGTACAAATT TTATATTTTA GTCGTATAAT TTTGATTCTA 
TATATGATAA AATTTTTGAT AAATCAATAT -AGATTCGTCA TAAACAATAT 
ATTATCAACA TTATTGCTAC ACGACAAATA TAAAAGCTTA AAAAAATTTA 
ACTCAAATAG AATATGAAAA CCTCATTTTC AAAAACATTA TTTCCTAAAT 
TTCACAAAAT AATTTAATTA ATTCTTTAGC TCTTTTAGAT CCTAAACTAA 



AATTTTTCTT 
CAAAATATAA 
GACTTGATTA 
AAATTATAAA 
AACTATCCTT 
TTATATTTAA 
TATCACTAAT 
TTGTCTTAAT 
ACAAGAACTC 



60 
120 
180 
240 
300 
360 
420 
480 
.540 
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ATTCAAAATG TCATGACTTT TAATTGGAAA CAATAAAGAT AAAGGGTTTA TATCGGTTTC 600 

CATATCTGAT AGTAACTTAT AAAACTCATA AAGACTTTTT TTTATGTCCT TTAAAGTAAT 660 

AATTTCAATG GCATTTAGTT CTAAATAAGT GTATATGTTT TCCACCATAT ATTTTTCATA 720 

AAAAAACATT TCCATTTTAA ATGGAATACA TTATATTTCT TTTTTAAGAT ATTTTAAACG 780 

TATGCTTTTA ATTTTACATT TATTATTAAT GAATTTATTT GAGCTAGCTT TTATATTTdC 840 

TAGTAATAAA AAAGGAAGCG AAGTAGATAC TATGATTACA GCTATTGATA AGTTAATTAC 900 

TATTTATAAG AAAGTCAAGT CCTAAGGTTT AAAATAAGAG AAATATATAT ATAAAGAATT 960 

TTTTGTGCTA TATTTATTTA CAACAAAAAT GAAGATTAAA TTTTTAACTA TAAGTTTAGC 1020 

TATCTTGcTA GCTAACTTGA TTATTATTTT ATTAAACTTG GTTTTATTTA TTGTAAATAC 1080 

ATCTACTAGT AGCCCTTATA TTGTTCCCTC AGAAAAGATT GATATTTTAC ATCAAAGTAA 1140 

TACAGGTGCG GTTAAATTTA AGATTTCCTT AATAAATCAT TTGGGCTCTG TTGCTATTGT 1200 

TTATGATTAC AATTCTGCTA GTGAAAGATT TTATTTAGAT TTTGAGATTG TAACAAACAA 1260 

GAAACCTTTT AATCTTTTAG ATGTTTCTCT TAATGATGTT GTTATTAAAC CTGAGGTTTT 1320 

ACTTGCATCC AATAGCAAAT TAAGATTCGA AGAGGGTCAG TATGTTTTGA ATTTTGACGA 1380 

CTCTATAGAA AAAACAGGAT TTTTTGTTGA CTTAGACCTT AGAAATGAAT ATTTAAATCT 1440 

AGCAGAAATT GCAAGAATCT CTGGCATTAA TTTTCGTGTT AAATGCATAG AAAGAGAAAC 1500 

AGGTGTTTTA CGAAATGTTT TGTTCAAATT AAGTGTCGAA AAGGGTAAAA AATTCTTTGA 1560 

CCTTATTGAA AGATATAACA ATAATATTGG CAAGGTTTCT TGATTATTTG ATTTTGTGGG 1620 

GAAAAAAAGT TTGATTTAAG GAAATATGAG GAATATTAGC AATtGTATCA AATATATTAT 1680 
ATTAAGAATG-CTTATTGGAT-TATTAATTTT TTGTTGTGCA ACCTTTGTTT GGTTGATTGG- - -IT^O- 

AATTTTTTAT TCAAATAACT TTAAAGAAGA GCGGAATTAT TCAATAAGCC CAATAGATAG 1800 

TGTTATTATG CGTAAATGTT ATTTTAAAGA ATTTAAGTCT GGACTTATTA AAAGCGTATT 1860 

CTTTAAGAAA TTAGATGTAA ATGTTAACTC TAAAAATTTT AAGGAGCTAA ATAAGGTAGA 1920 

TAAACAAAAT CTGCTAAATT CTTATCCATC TTATCATATG GAGTTTGTCG TAGTTGATAA 1980 

TGGATTTTTA ATGAATTTTA AAAATGTTAT TTTTAATGGT ATAGATGATG CTAAATTATA 2040 

CGATCAACGT GATATGGTTT ACGGAGGATT TAGATACTCA AAAGAGGCTT ATTTCCAAAT 2100 

TATTGGCAAT TATGATGTTA AATTAAATAA AATGAAACAA TATACTCCAG CAATTGTAGT 2160 

AAATGTTTTC AAAATTAACA TTAATGATGC TTTATTTAAC TCGTTATTAA AGCAAAAAAC 22-20 

TTTAAAAGTT ACTTTGATTT CCCATAAT7>lA TAAAGAGTAT ATTTTACAAA CTAATAATTT 2280 
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CTTATCAAAG TATAATTTTC^S^CACCAGA AAAGGAGAAT 
AGAATTTTAT TTTAAGTTTA ATAATGGGTT GATCATGTCT 
TGCCTCCCCT TTATCAGAGC AATTATTCTC TATACCCCCT 
AATAAATATA GTTTCATAAA ACAATTTTTA TGTAAAAAAA 
TATATATTTA TAATATTATA TTATATAAAA AGATAGGTCT 
TTAACATCTA ATCATCCTCC AATAATAATC TTTACTATTG 
CTAATATGCT TAATTATAAT ATTTATTATA CATGGCATAA 
AAATTCAAAT CCATAAACAA CAGTCTACAA AAAATAACAA 
AAAAGAGTAG GACAATTAGA ATCCATATCA AAAAAATTAG 
AAAAAACCTA TAAGCTTATA TGGACTAAAA AAATCCCAAA 
GATTATTTTC ATTTTTTTGA TTTAATAACA AATAATCAAT 
TACATACAAA AAGCTACACG CAACAAGGCA AGGCAAAATA 
CAATATCAAG CACCCCTTCC CCTATAACTA TTTTAAAAAA 
ATACTTATAA ACCTTTTTAA TAAAAAACAA AATTTATTAT 
GTTTAAAATA CATATAACTC ATTTTAGCCC ATCAAAAGAC 
ATTTTTTAAT AAACTCTACA TTGGGTTGGA CAATGGAATC 
ATATTTCATA CTTTTCATAG TATGAAAAGT ATGAAAAAAA 
TCCTAAAATT TATTTGTTTT TTTTATGATA TAACAAAAAA 
TCQGATATAA AAATTACCAA AGAGAAATTT TTATGAAAAA 
ACGTATTTTT ATATATATCA TTACTTTATT CGTGTTCTTG 
AAATCATTAA AATTAAGAAG TGTTAAAACT AATGAAAAAT 
TTACAAAACA TAAAAGATTT CTTCCTGCAA AGTTATTTAC 
TAGCTTAAAA GCGGATATAA ATATTATTGT AAGAAGAAAG 
TAAAGGTTTG GaTTATTCTA TTTCTGcTTT GTTTGTTTTA 
CTAATGTTGA TTTTTTTACC TTTTTTTATT TAAATTTATT 
(2) INFORMATION FOR SEQ ID NO: 33: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3653 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AGTTCTTACT^XAGAAATTAA 2340 

TATGGTCAGC AAACCAAATA 2400 

CTTTTATATA CTTTCTATAT 2460 

GCTAACTGCC TTATTATTGC 2520 

GAAACAATAT GGATAAATTT 2580 

GGGCTTTGTG TGCAACCGTG 2640 

TAAATCCCAT TCTTATAAAG 2700 

AAGAATTTGA AGAGATGAAA 2760 

AGCTAAATAA TAAACCTGCA 2 820 

TCTAATGTAG ATTTACAACC 2880 

AAAAATAATT TACAAATAAT 2940 

AATTATTAAA AAGCGAGCAA 3000 

AATTAAAAAG GTTTAACGGT 3 060 

AAACCTCAAT AACAGTAAAT 3120 

ATTTTCAACT TTATTTTACA 3180 

TAAAAATTCT TTATTCTTTA 3240 

TGATTAATAC TACAATACAT 33 00 

ATGTTTTATA AATTTCCAAT 3360 

AGACATATTA TATACTTTGA 3420 

GATGCCATTA AAATCTTCAA 3480 

CCATTAATTT TAAGGAAGGT 3540 

CTACATATAC TTAATAGTAA 3600 

TCGACAATTT TGATACTACT 3660 

AAGCGATTTA TGGTTTGAGG 3720 

3760 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33: 

CTTGnGTGCC TGCAGGTCGA CTCTAGAGGA TCCCCGTGTT CATAAAATCC TCTCCTTGAA 60 

GGTGTTACTT TTAAATTAAG TAAAAGTAAT AAAAATAGAT AAAAATAGTA ATTTATATTG 120 

TACCAAAAAC GAAAAATTTT AGTCAAATTT TGTGAGTTCT CATTGCATGA GAAATTTGGG 180 

TTGTAGGGAG GCTGTTATAA ATAGAATGGG CATTTTCTGA GGGTGTCGGC TAAGAAAGAC 240 

TACATACTTT AGCTAATATA TAGCAAAGAC TTTGAAATTT AATTTGTATG TGTTTTATAG 300 

TCTTTTGTAA TGAGTAGTGC ATTTGCAATG GAGAGATTTT GGGGAGTTGT TTAAAATTAC 360 

ATTTGC6TTT TGTTAAAATG TAACAGCTGA ATGTAACAAA ATTATATATT TAAATCCTTG 420 

AAATATTGCA . TTTATTATGT ATTGTGGTAT GATTAGGACT TATGGAGAAA TTTATGAATA 480 

AGAAAATGAA AATGTTTATT ATTTGTGCTG TTTTTATACT TATAGGTGCT TGCaAGATTC 540 

ATACTTCATA TGATGAGCAA AGCAATGGAG AGGTAAAGGT CAAAAAAATA GAATTCTCTG 600 

AATTTACTGT AAAAATTAAA AATAAGAATA ATAGTAATAA CTGGGCAGAC TTAGGAGATT 660 

TAGTTGTAAG AAAAGAAAAA GATGGTATTG AAACGGGTTT AAACGCTGGG GGACATTCGG 720 

CTACATTCTT TTCATTAGAA GAGGAAGAAA TTAATAACTT TATAAAAGCA ATGACTGAAG 780 

GTGGATCATT TAAAACTAGT TTGTATTATG GATATAATGA CGAAGAAAGT GATAAAAATG 840 

TCATTAAGAA TAAAGAGATA AAAACAAAGA TAGAAAAAAT TAATGATACT GAATATATTA 900 

CATTTTTAGG AGATAA/^TT AATAACAGTG CGGGGGGAGA CAAAATAGCT GAATATGCAA 960 

TATCACTAGA AGAGCTTAAA AGAAATTTAA AATAGAAGTT AGAAATATAG GAGAGAGGGT 1020 

ATATGAATAA AAAAACAATT ATTATTTGTG CAGTTTTTGC GCTGATACTT TCTTGTAAGA 1080 

.^ATTATGCAAT TAAAGATTTA GAACAAAATG CAAAAQGGAA. AATTAAAGGA TTTATAGATA 1140 

AGGCTTTGGA TCCAGCAAAA GATAAAATTA CTTCAAGTAG TTCAAAAGTA GATGAATTAG 1200 

CAAGAAAATT ACAAGAAGAA GATAAAATAA AGGGTGTAGA AGAAAACAAT AAAGATGAAT 1260 

TAATGCAGGG TGATGATCCT AATAGTGGTG TAATAAATTC GTCACCAGTA TTGCCAGAAA 1320 

ATAGTCAAGA TAATACACCA ATATTAAAAG CAGCGGAACA AAGTGATGGT CAACAAGAAG 1380 

AGAAAGTGAA AAAAGTAGAA GAATCCGAAG CTAAAGTTGA GGGAAAAGAA GAAAAACAAG 1440 

AGAATACAGA AGAACGAAAC AAACAAGAAT TAGCTAAACA AGAAGAAGAA CAACAAAAAC 1500 

GAAAAGCAGA ACAAGAAAAA CAAAAAAGAG AAGAAGAGCA AGAAAGACAA AAAAGAGAAG 1560 

AAGAGCAAGA AAGAAAAGCT AAGGCAGAAA AAGAAGCTAA AGAAAAAGCA GAAAGACAAA 162& 

AACAAGAAGA ACAAGAAAAA CGAAAAGCAG AAAAAGAAAG AGAAGAACAA CGAAAAGAGG 1680 



wo 98/58943 PCT/US98/12764 

995 

CAGAAAAAAG GCAaGTTGA^^ACGAAATTA GAACACTTAC AGGCAAAAT^^ATGAAATCA 1740 

ATAGAAATAT TGATGTTATA AAAGAGCAAA CTAGTGTGGG GGCACAAGGT GTTATAGATA 1800 

GAATTACAGG GCCTGTATAT GATGATTTTA CTGATGGGAA TAAAGCTATA TACAAAACTT 1860 

GGGGGGATTT GGAAGATGAT AACGACGAAG GATTAGGAAA GCTATTAAAA. GAATTGAGTG 1920 

ATACTAGACA TAATTTAAGA ACCAAATTAA ATGAGGGTAA TAAAGCATAT ATTATTGATA 198G 

CTAGAAGCAC TGAACCCCAA TTAAAAGAAA ATGTAAGTGT TAGCGAAATT AAATCAGACT 2040 

TAGATGAACT AAAATCAAAA TTAGAAGAAG TTAAAGAATA TCTTGAAGAT AAAGATAATT 2100 

TTGAAGAAAT TAAAGAATAC GTTGCTGGTA GTGAGGATAA TTATGATGAA GAAGATTAAT 2160 

TTTAGATATA ACTAAATTTT GTATACACAA AATAACAACT AGTAAAAAAA TGACTAGTTG 2220 

TTATTTTTTT GTAGATTTCA TTGTTATAAA TATAGAAATG TTTTCTATCA AAACTTTCAT 2280 

TCAAAAAATG CCAAAAACTA TTGCTCAAAA TATTGTTTAT TTATATACTC TCTAGAGTTA 2340 

TGATGAATAT AAATGAGATT TCAGATTTTT ATGATAATTT ATATAAGAAA ACAAAAAAAG 2400 

AAATAGATAA ACTTATAAAC AAGCTCTATT TAACTAGCCA AATAACTCTA AAGCAAAAAA 2460 

GACAAATATA CAGTGCTGTT GAAAAAATGC AAAAGTACGT AATAAAAACC GGAAAAAGTG 2520 

TTTTTTTAGA ATCGGAAAAA GAATTTGTTA AAGACACTTT GAAAAGAAAA AATCTAACAA 2580 

AAAAATTTCA AAGTTTCAAA GTTGATTTTA GCTACAAGGA AGGAATGCTA GAAAAATGTT 2640 
TAGAAAGATT AGGAGAAGAT AAATCTATCG AATTTTTGAT TTTTGTTTGC CAAATTCTTA . 27 00 

ATGGGATAAG AGAAAAAGTA TCAGAATTAG ACTTTCAAAT AGATGCGATT AAAGAATTTA 2760 

GAGATATTTT ATTTTTGAGT ATACACTATT ATGATAAAAG ACTTTTCACC- AGTAAGAATC 2820 

TTATGAATGA AATGAAATAC TTTTTCGAAA AAGTAGAGTT AATTTATAGT TATATGCAAT 2880 

AAATTAGTGA ACTGCTATTT CTAAATCAAA AATTATAGAA ATAGCAGCGA ACTAAATCAA 2940 

TAAAAGCTAA CAGATATTCC CTGTTAAATA TCAAGAAGTT ATCAGTTTAT GTTAACAATT 3000 

AACAAATTGC TTTACTATTT AGAGTAACAA ATTGTTACTT TTGTTATTTT AGAGGATTTT 3060 

TTTGAAAAAA GTTAAAAGAT CTTTTGATGA TTATGTTGCA TATTTTAGAG AAGGATCGTT 3120 

AAGTGATGTA GAAATAGCGA AGAAATTAGG AGTTTCTAAA GTAAATGTGT GGAGAATGAG 3180 

ACAAAAGTGG GAAAGTGGAG AAAGTGTTGT TAACGGGGAC TCTAGAGTAA CAATTAGTGA 3240 
AGATACTTTT GAACACCTTT TGTCGCAAAC CTTTAGATCA GAAGTTAACG CTAGGAAAGT ■ 3300 

TAGAAGCGAA TTGGATGTAG AGCGGTCTAA TTTAGAATTA GGATTTATAA ATGCATTTAA 3360 

GCAATATTCT AGTGTTGAGC TTTTTAGTAT GCATACTAAA ATAGAAAATT TAAGAGCCGA 3420 

AATTGACGCT TTAAATAAAG CAAGTAGTAA AAAAAACAAG CAAGTTGTTA ATGGAGAAAT 3480 
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TAATTCTTTA AAAAGCGAGC TTGATGAATA TATAAAAGAG TGTTCAATAA 



GAGAAATGGA 



3540 



GCTTTACTAT GAATGTATGA AAAAACTTGC TACGGTTAAT GGAGCTGAAA 



GCAAAAGTAA 



3600 



CTACAAAAAT AGTAAAGGGC ACAAGTGAAC TTATATCAAA CAAAACTTTT 



TAC 



3653 



(2) INFORMATION FOR SEQ ID NO: 34: 

(i) SEQUENCE CPiARACTERISTICS : 

(A) . LENGTH: 3432 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34: 

CAnTTTTATG GAGGTTCTTA GATTTTTTnG TATTGCTTCT CATAATT7UVA AAAATAGAGA . 60 

ATAAAAAGGT CTTCCCGACT TTTCTTAATA TGGAACAATT GnCAATAAGG AATTCATAAG 120 

GAAAACTTAA AGCTAATATA TCATCTATAA ATAATAAAAA ATATTAAAAA ATAGAGGTTG 180 

AAATTTTTAC ATATTTTATA CATAATAATA ATTATTACAC GAACAAATAG GAGAAAAGAT 240 

GGCATTAAAT TTGCTTAACC ATAACCACAA CAAAACCAAT ACCAACAAAC TACTTTCAAA 300 

AGATTCAAGG CTCAAAAAAA TTATTTCAGT AATTAATTAC TTAAATAAAA GTTTTGAAAA 360 

AAAATATGAT ATTTCAATAT ATAGAATTCA TTTTAATTCT GAAAAACTAA AAGAGCTTTA 420 

TCCTCATCAT CAAATAGATA TCCTTAGAGT TTTAAACTCT AATATAAGCA AAGAAGGCTA 480 

TAAACCAACT GTAATAAGAA CCTTAAGAGA AGACCTAAGA TTTTTAATTC ACATAAAAGC 540 

AATTGAAAAA AAAATATTAA CATTCTCAAA TAACTTAGGA AAATTTAAGG GAAAATTATG 600 

TATATATAAG. GTCTCG^CTA . TTGQATATAA ATT^i?iTATCT . GCTTATTTTG AAGCTTATAA . 660 

AGCAGACCTC TATAGAAAAA TAAAAAAGAG TAAAGACGGG CTTGATACAC AAAATGTAAC 720 

TAAAAATGTT ACTGTATATA TAAATTATCA TAAAAATATA TATAATAAGA ATTCTATTGA 780 

AACCGTCTTT AAAAAATCCT ACACTAAGAA AAAAACAAAA AAGAAAAACA AAAAAGAATT 840 

CACAAAAAAT AATTTGGAAA AAAGGTTGAA ATTACCTGAA GAAATAACTA AAGAAATTAT 900 

AAGTATAGCA AAAAAAACTA AAAATCCAGA TAAAACTTAC AAAAATACGC TTTTTAATTA 960 

CAAAGATTTC TTAAACTATT TATCATATGA CTATAAAAAA GAAGATATTT CATATTTCTT 1020 

TTTGAGCAAA CTTAAAGAAT ATAAAAATAA AATTCACTTT ATGAGAAAAT ACGCTCCTTA 1080 

TAAAACAGAC TTTTACCTAC TTGCAGGAGA ATTCAAAGAT TCGTACCATT CTAAATGGAA 1140 

AACAAATAAA, AAAACCAATT TTAGCGGACA TGTAAAAGAA ATAGCCAACA ACATTCTAAG 1200 
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TAAAATTTTA GAAAAGGAG^^AAAGTTTGA ATGATTTACT AGAAAAACTAaAAGCGAGAA 12 60 

AAAAAGAAAT AATAAGCAAG AAAGAAGCGG AATATAACAA TAATATAAAT AAAGGAACAA 1320 

AAGAAAGAAC TGCCTTTTTT AGAATTGAAG AAATAGATAA TAAAAAAATA TATTATACAA 1380 

AAATCTTTAA ATATTTAGTA AAATTTAGAA TTGCCAATAA AGACAATAAG CTAAGTTTT^ 1440 

CTTTCCAAAA ACTTAATAAT AAAAAAAATT ATTATTTATT TAATCTTTTT CCTCTAAAAG 1500 

AAGAGAACAA GTTTCTAGGA ATAAAATATG GATGGGACAA ATTAGAAAAG CCTTTTTTTT 1560 

TAAGGCAAAA TAATAAATCT TATGTAATAA AAAAACTTTA TTATTTAGAA TTTAAATTTA 1620 

GCAAAGGGTC TATTAAGTGT TACGTTCAGT CTCTTAGAAC ACTATTAAGA AAAAAAGACA 1680 

AAGAAAGTAC CAAATATTAT AAGTTTAATT TAGAACACAT AAAAAGAATG GAAAATACCG 1740 

TATATAAATT TTACAGTAAA AAGCTAAAAA ATAAAGGAGT AATATATAAA TGGATAGAAA 1800 

AAAATCAAAT ATTATAACAA TAGCAAATCT TAAGGGAGGT GTAGGCAAGA GCACACTATC 1860 

AATACTGTTT TCTTATGTAT TAAAGGATTT GGGTAAAAAA GTATTGCTTA TTGATATGGA 1920 

TTCACAAAAT GCTTTAACTT CATATTTTAG AAAATATGTT TTTAATTTTG ATTU^AAATAA 1980 

CATTTATAAT TTATTAATAG GCAATGTTTA TTTTGATCAA TGTATAAGTA AAATCAACGA 2040 

TAATATTTTT ATAATTCCAT CACATCCTTT TCTTGATGAA TTTAATGATA AAAATTTGGA 2100 

TAATAAGGAA AATTTATTGA GTTTTTGTTT AGACAAAAAT GTTTTAGGCC ATGATTTTGA 2160 

TTATATTTTT CTTGATACTC CCCCTAGTTT TAGTTTTATT TTAAAAAATG CATTAAATAC 222 0 

TACAAATCAC ATTATTATTC CAGTTCAACC TGAAACATGG TCAATAGAAA GTTTGGAGAT 2280 

ATTAATGAAA AAAATTACAG ATAAAAGCTA CAATATTTCT ATTGTTGTAA ATCAATTTAT 2340 

TAAAAACAGG AATATACTTA AAGAGGTTGA AGATGCTCTA TATAAACGAT ATAGTAACTA 2400 

TATAAAAGGT AAAATTCATT ATTATAATAG TATAAAGGTT TTTATAATTA ACCGTTTGGA 2460 

ACCAGATATA AAGAGCAAAT ATTATAAAGA AGCAAAAGAT GTATTAAAAA ATATTTTAGA 2520 

TTTGTAACAT TTTTTTATAT TCCCCCGGGG GAATATAAAA AAGGGAGTTT AAAATGAAAA 2580 

TAAAAGCCGA AAAAGATAAA GAAGCATTAT TTAGTAATCG TTTTGGGGAT TGCAATGAAG 2640 

AAACAAATTT AAATGACGAT CAAGATAAAG AATTGGCAAA TTATAATAAT CTAAAAGAAC 2700 

AGCTTAAGTA TAATTTAAAA GATGATATTA ATAATAAAAT TCAAAGAATG AAAATATTAT 2760 

ATGAAATTAA ACAAAAAGAA TTATATAAGT ACGATGGTTT- TGCTCGTTTT AATGATTTTA 2820 

TAAAATCTTT TGAAGTTGCA AAAAGTCAGG CTTATAGiSTA TTTAAAAATT TATCAAAAAG 2880 

TTCTAGAGGG TAAAGTGTCC ATTGATAA7VA TAAAAGAAGT GGGCTTTAAG GCTATATTAA 2940 

GAGATATAAA GGCCAAAGAT TCTTTAAACG AAGATAACCA TAGTGAATCT GAAGGCGCTA 3000 




3060 



AAGATACTAA AAGATTGTAT TTTATTATTG AAAAAATTTA TAAAGAAAAG AGAGATGTTT 



3120 



TATCTGAGCT TATAATTGAG TATGAAAAAA ATAAAAAATA AAAAATAAAA AATAAGCCTA 



3180 



TTGATTAATA ATGTATATTA TGATAGCATT TAATCAGGTT GGGATTTAAT TTCCTATACT 



3240 



ATTTGTTCGT TGTAAACGGA AGTGCCCATA TCGGGCTTTT TTGCTATATA TAATCTTAAT 



3300 



CAAAAGTAAC TATTAACTAT TAACTATTAA CTATTAACTA TTAACTATTA ACTATTAACT 



3360 



ATTAACTATT AACTATTAAC TATTAACTAT TAACTATTAG TAGATTTAAG TTTTTCCCCG 



3420 



ACTTAATTTG AA 



3432 



(2) INFORMATION FOR SEQ ID NO: 35: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3398 base pairs . . 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35: 

ATAATAATAA TGATTATGAA ATGCTCAAAA ATCTTGGTAA AGGGGTTTTA ATGAAAAATG 60 

CCAATGAATT TCTTAAAATT AATTTAGCAA AGAATGAAAT AACAAGATTT AGTAATAATG 120 

AGGATGGCGT TGCTAGGTTT TTAATTGATT TTTTTAAGCT TAATATTAAA TATTAATAAT 180 

TTGTATTTAA ATGTTTAATC CATTTGATTT ATTTTTAGCA GGATTTTCTA TTTAAAATAT 240 

AAATTTTTTA CTTATAATGT ATTTTTGT^AA ATTTATTTAT TAAAATATTG GAATAAGTAT 3 00 

TGACATGGAT TAAACAAAGA TATATATTAT TTTATGTTGy ATAAACAAAT^ TGGCAAAATA .36.0 

GAGATGGAAG ATAAAAATAT GGTCAAAGTA ATAAGAGTCT ATGGTGAATG CCTAGGAGCT 420 

TTAAGGCGAA GAAGGtCGTG GTAAGCTGCG AAAAGCTTGG GGGAGAAGCA AACATTTATT 480 

GATCCCAAGA TTACCGAATG GAGTAATCCA GCTAGCAAGA TGCTAGCTAT CTATTATTTA 540 

AATAATAGAG GCGATACCAG GGGAAGTGAA CCATCTAAGT ACCCTGAGGA AAAGAAATCA 600 

AAGAGATTCC CTTAGTAGTG GCGAGCGAAA AGGGAGTAGC CCAAACTTTA AATGTGTCAA 660 

GCTGCAGAGC GTTGCATTTA TGGGGTTGTA : GGACGTTTAG GCTTAGTCTG TAATAAGCAA 720 

AAAAGTTACA AAATATTTAT ATAGAAGAAT AATCTGGAAA GTTTAACCAA AGAAGGTGAT 780 

AGTCCTGTAA TTTAAATGTA AATATCTTTT TAAAATGTTC CTGAGTAGGA CGAGGCACGA 84Q. 

GAAACCTTGT TTGAAGCTGG GGAGACCACT CTCCAAGGCT AAATACTAGA AAGCTACCGA 900 
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TAGAGAAGAG TACCGTGAG^^KaAGGTGAA AAGAACCCCG GGAgGGGAG^BAAATAGAAC 960 

TGAAACCGTA GACTTACAAG CAGTCAAAGC CGTAATTTAT TGCGGTGATG GCGTGCCTTT .1020 

TGCATAATGA ACCTGCGAGT TATCATGTCT AGCAAGATTA AAGCATAGAA GTGCTGGAGT 1080 

CGAAGCGAAA GCGAGTCTTA AAAGGGCGAT TTAGTTAGAT GTGGTAGACC CGAAGCCGAG 1140 

TGATCTATTT ATGGCCAGSsC TGAAGCTTGG GTAAAACCAA GTGGAGGGCC GAACTCTAGT 1200 

CTGTTTAAAA AGGCAGGGAT GAGCTGTGAA TAGGAGTGAA AGGCTAAACA AACTCGGAGA 1260 

TAGCTGGTTC TCCCCGAAAT GGATTTAAGT TCAGCCTTAT TTTAGTTTAA TAGAGGTAGA 1320 

GCACTAATTG AGCTAGGGCC TGTCAAAGGG TACCAAACTC AGTTAAACTC CGAATGCTAT 1380 

TAAATGATGA ATAGGAGTGA GACTATGGGC GATAAGGTTC ATAGTCGAGA GGGAAACAAC 1440 

CCAGACCAAC AGCTAAGGTC TCAAAAATGT GTTAAGTGGA AAAGGAGGTT TAGGTACGTA 1500 

AACAGCCAGG AGGTTGGCTT AGAAGCAGCC ATACCTTTAA AGAGTGCGTA ATAGCTCACT 1560 

GGTCGAGTAC TTAAGCGCCG ATAATGTAAC GGGGCTAAAC ACATTACCGA AGCTTTGGAT .1620 

CTTAACGAAA GTTAAGATGG TAGGGGAGCG TTCTGTAAGC CAGAGAAGTT AAGCTGGAAA 1680 

GTTTGATGGA GGTATCAGAA GTGAGAATGC AGGTATGAGT AACGAAAAAA TGGGTGAGAT 1740 

TCCCATTCGC CGAAAACCTA AGGTTTCCTG GGTAAAGGTC GTCTTCCCAG GGTTAGTCGG 1800 

CCCCTAAGGC AAAGCTGAAA AGTGTAGTCG ATGGGAAACG GGTTAATATT CCCGTACCTC 1860 

TTATAGTTTC GATGGAGTGA CGCATGAGGT TAACTACTGC TAGGCGATGG TTGTCCTAGT 1920 

TTAAGCATTA AGGCGATGAT CTTAATAGGA AAATCCGTTA AGAGAGCTAA GATGTGATGA 1980 

TGAGTGCTAT TTAGGTAGCA TGAAATGTAG GTAGTCAAGG TGCCAAGAAA TAGCTTCTAA 2040 

GGTTAGGCTA TAAGGGACCG TACCGCAAAC CGACACAGGT AGGTGGGATG AAAATTCTAA 2100 

GGCGCGCGAG AQAATCCACG TTAAGGAACT CTGCAAAATA CGTACGTAAC TTCGGGATAA 2160 

GTACGACCTA AGCAATTAGG TAGCATAAAA ATGGTCCAAA CGACTGTTTA CCAAAAACAC 2220 

AGGTCTCTGC AAATCTGTAA AGAGAAGTAT AGGGACTGAC ACCTGCCCGG TGCTGGAAGG 2280 

TTAAGAGGAG ATGTTAGTTT ATGCGAAGCA TTGAATTTAA GCCCCAGTAA ACGGCGGCCG 2340 

TAACTATAAC GGTCCTAAGG TAGCGAAATT CCTTGTCGGG TAAGTTCCGA CCCGCACGAA 2400 

TGGTGTAACG ATTTGGACGC TGTCTCAACG TGGAGCTCGG TGAAATTGAA GTATCGGTGA 2460 

AGATGCCGAT TACTTGTGGT TAGACGGAAA GACCCCGTGA ACCTTTACTA TAGCTTGGTA 2520 

TTGAGATTTG ^TTAAATATG TGTAGGATAG GTGGGAGACT TTGAAGCTAT CTCGTCAGGG 2580 

GTAGTGGAGT CAATCTTGAA ATACCACCCT TGTTTAATTA GGTTTCTAAC TTATAGAAAT 2640 

ATGAGGAGAG TGCCAGGTGG GTAGTTTGAC TGGGGCGGTC GCCTCCTAAA GAGTAACGGA 2700 
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GGTGCGCAAA GGTTACCTTA GAGTGGTTGG AAATCACTCT GTAAGTGTAA AGGCATAAGG 2760 

TAGCTTAACT GTAAGACTGA CAAGTCGAAC AGATACGAAA GTAGGTCTTA GTGATCTGGC 2820 

GGTGGCAAGT GGAAGCGCCG TCACTTAACG AATAAAAGGT ACTCCGGGGA TAACAGGCTT 2880 

ATCCTTCCCA AGAGTTCACA TCGACGGAAG GGTTTGGGAC « CTCGATGTCG GCTCATCGCA 2940 

TCCTAGGGCT GGAGCAGGTC CTAAGGGTAT GGCTGTTCGC" CATTTAAAiSC GGTACGCGAG 3000 

CTGGGTTCAG AACGTCGTGA GACAGTTTGG TCCCTATCTG CCAGAAGCGT TGGATATTTG " 3060 

AGAGGAGCTA TCTTTAGTAC GAGAGGACCG AGATGGACGA ACCTCTAGTG TrCCAGTTAT 3120 

CCTGCCAAGG GTAAGTGCTG GGTAGCTACG TTCGGAAAGG ATAACCGCTG AAAGCATCTA 3180 

AGTGC3GAAGC CTTCCTCAAG ATGAGATATC CTTTAAGGGT CCTGGAAGAA TACCAGGTTG 3240 

ATAGGTTAGA AGTGTAAGTA TAGCAATATA TTAAGCTGAC TAATACTAAT TACCCGTATC 3300 

TTTGGCCATA TTTTTGTCTT CCTTOT^AAAA ACCCTGGTGG TTAAAGAAAA GAGGAAACAC 3360 

CTGTTATCAT TCCGAACACA GAAGTTAAGC TCTTATTC 3398 
(2) INFORMATION FOR SEQ ID NO: 36; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3203 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36: 

GAGAAACCAA GAATTAAATG TAAAAATAAA GATCGTTTCA TAAAGATTGA AAAAGAAAAT 60 

GACAAJyiCAA . TQTATCA AAAAATAATG ATGGATATTO^ .i^TJ^^ AATTGACAAT • ' ,120 - 

AAAAGAAATG AATGTCGTAT ATCATTAAGA ACACTATTTA ATCAAATGAA AGTAGAAGAA 180 

GTTCGTTTAT ATTCTATAAA AGAAGGGGAC AAATTTTTAG GTATTTACTA TGGATATAGA 240 

AAACCTATAA AAAACATTTT CGTAAAATAT GAAATAAACG GAACCATAAA GTCATATGGA . -300 

TTATCAAAAG CACATTACAT AGAATTTAGA TTTAAAAAAG GAAGCGTTTT TTGTTACTTT 360 

AAAGGATTAT TTCGCTTATT AAAAAAAGAA AAAGAAAATA CACCATATAA TATGGCTTGT 420 

ATTGATATGT TTACAAAACT AGAGAAACAC GTATATGAAT TTTACGGTAA AAAATATCCA 480 

QAAAAAGGAA TAATTATAAG ATGGATAGT^ AAAAATCAAA AATAATAACA ATTGCAAGCC 540 

•irfAAAGGGGG CGTTGGTAAA AGCACAACTT CAATAATACT TGCAAATCTA TTATCGAAAA 600- 

AGCATAAAGT ACTTTTGATC GATACAGATG ATCAAGCTGC TACTACAAGC TATTATTATA 660 
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ATGAATTAGA AACAAAAAA^^ffcGATATAT CTAAAATGAA CATAGGAAA^^R'TATAAAAG 720 

ACGGTACAGA TATTAATAAA AGCATTATTA ATGTTGAAAA TAACATAGCT TTGATACCCA 780 

GTTATATAAC AGTCGATGAA TTAAATGGAG AGTATTATTA TGATAACCGG CATCTTCCAA 840 

TTGAATTTTC ATTAAAGACG AAATTAAATT CCATAGCAGA CAACTATGAT TATATTATAA 900 

TTGATACTAA TCCCAAAAGG AATTTCACAT TAAAGCTTTC CCTAATTAGC AGTAATTATG 960 

TAATATCTCC AATGACGGCA GAAAAATGGG CAGTTGAAGG ATTTGAAACA TTAAGAAGGT 1020 

ATATAAAAGA AGTTGCTGGA ATACCAATAT TTATTGTTAT TACAAGGTTT AAAAAAAATG 1080 
TTACCCACAA GCAATTAATG GAAATAGTAA GCATGAAAAA CGGGTTTTTG GGATACATAA - 1140 

GCGAAAGAGA AGATTTAAAT AAAAGAATAG GGTGTAATGA AAAATTTGAT TTTTCAAAAG 1200 

ATTACATTAT TGAATATAAA AAAATATTGG ATGTTTTTTT GGGAAAATTG TAAGAATTGA 1260 

CAAACTTAAT AAGTCCGGCA TGCCGGACTT ATTGGAAATA AGGGCAAAAA TATGAATAAA 1320 

AAAAACATTA ATTTAAAAAT TAATAAAAGA ATTTCAGAAA ATAATTTAAA TTATATTCTT 1380 

GATCAAAGCA ATGAGAATCA AAGAAAAGAA GAATTTGAGC GATTAATTAC ACAATTAAAA 1440 

AATAATATTA AATCAGAAAT ATACAATATT ATTGATACCA TGAAGATCCT TAAGAAAATA 1500 

AATGACAAGA GGCTCTATTT AGAAGGAGGA TATAAATCTT TTAAAGATTT TTTATCAGAT 1560 

TTTAAATTAG CAAAGACACA GTCTTATGAA TATATAAAAT TAGCCGCTGC AATTGAGGCG 1620 

GGAATATTAG AAAGAAAATT TTATTACCAA TAATGGAATA AGGGCCTCTA TAAGATATAT 1680 

TAAAAATCAA GCAAATGGTA CAATAAAAAA ATCAAAACAA AATCCAATAA AACCATTAAG 1740 

ATTTCAACTC AAGAACCAGG AAAGTTATGA CTTTTATAAA AGCAATTCTA GGTTTGTAAG 1800 

TTTTATGATG GATGAGATTT TTAAAAATCA AAAAGATTTT CTTAATAAAC TTTTAAAAAG 1860 

ATATAAGG?^ TCAAAGGGAC AATAAGAAAA TTTTATAAGC AATTTAATCT TTAATATTAT 1920 

TGAAATATAA AATATAAAGT TAGAAATTGT AAATAATTGA TTTAACAAAT AAGGAAATAT 1980 

ATACAAAAAA GCAACTGAAA ATTTAAAAGA TCATTTGCTA AGCAGAGGAA TTTTATTTGG 2040 

TTAAAGTATT TGAAAAAAAA TTAAATATTA TCAAAGAAAA AGGTAAATTG ATCTCAATTG 2100 

ACAATAAATT GTCAGTAATA AGCAACGAAG AATGTTTTTA ATTTTGATTA TAATAAATTT 2160 

TGCAAAGAAG CACGCTTAAT AAGCACGGTG TAATAAGTTG GGCAATATCT TGATTAGCAA 2220 

CAATGTGTTT TGATAATCAA TGGTAAGACG AACACTTAAA AATATTTTAG AAGGAACAGG 2280 

GCATTTAAAG TAAATTTATA TATATTTAAG AGTAAGGATT TGAATAATTT ATGATTTAGA 2340 

GCTGTAGAAT TTATTAAAAT ACAAGAGCAA CTATTAAAAA AATGGGCAAA TTAGAAACTT 2400 

TAGCAGGGGT AGTGATTTAT AAGGACGGGG TGTTAATGAC GATATTATAT AGGCTCAAGG 2460 
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6CCAGCAAGG ACTACTATTG ATTATATAAA CACTGTTGTT TAAGATTTTA AAAAAAAGAG 2520 

GCTATTTTAA AATAACAAAT ATTTTATAGA ATTTATATTC AAGCATAAAT TTAGGAATTA . 2580 

AAATCAATGA GTTTACTATG AATCTTGAAT TTGTTTTGTT AAATTCAAAA CCACCACACC 2640 

CCTATTTTTT AGCTATCTAA TTAAGGGATC CATATGTGTC CCCTTTATTT TTAAATAAAA 2700 

GATATATATT TAAAGACAGT TAGGCCTCTT TTAGGCATAT TTTTGTTTAA TAAAAAATAT 2760 

TAAATTAGGG TTTATAATTT TTATAGATGA AAATAAAATA GAAGAATCTA ATTTAACTAA 2820 

ACAATTTTTG TTTAGTTAAA ATGATATAGG GCTTTGCAAA GTAGATATAA TTAAAGAAAA 2880 

TCTAAAATCG CTAAATAAAA CTATTTAAAC TAAGCCCCAT AATGAAAAAG TTTTAGTAAA 2940 

AATATTAAAG AATATTTTTA CTAAAATAAA AATTAAACCA GCATTAATAA TACTTACATT 3000 

AGATGATTAG CTACTTTTTT TAATTAATAA A'TTTTGCATT TAAAGTTCTA TTCCACTTAT 3060 

AAATATTGAC TATATCAATA ATTTTTCAAG CATTGGTACA TTTTATATTC TAAATATTTC 3120 

GTTTTGTCGC TAATTTGTTG ACATAGGAAT TATAAAAAGG CCATCATCTT TTAAATTAAA 3180 

AAGTAAAATA ATACTAATAA ATA 3203 
(2) INFORMATION FOR SEQ ID NO: 37: 

( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3189 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37: 
T;iH3CTAAAAA..TATATTTTTT^TATATCTtGG CTCTACTACA ACTCCTTTAT TTTTAGAGTA . • . .. 60 

ATAAATAAAT CTGCTGCCAA ATAACCTATA AGATATTTTT TAAACATAAC TTGGATCGAT 120 

ATTTATAGAT TTAAAAATTT TTAAATCTAT AATAACTTCC AAAATACAGA ATCTTCACCT 180 

AGATTATAAT TGTTTATAGC ATATTCTTCT TTTGAATATG TAAATTCTTA AGCTTATTTA 240 

AAAGCTTTTT TCTTGTATA6 TCAATTAGCT ATTTTAGCTT TTCTGGTTTG AACGCCAATA 300 

CTAAAATTAT TGAAAATATC TTTTAAAGAA ATCCCATTGT CATAAATATC TTTATTTGAA 360 

AAATCTTTTT AGTAAAAAAA TAATGGGGAT ATTTGTATTC AAGTTTTTCA AAATTAATAG 420 

TAAAGATATT GTTTTTTCCT AAAAACCCAT ATTTTTTTTC TCTTTTGCCT TTAATACTTT 480 

TGTAAAATAC TTTAATCAGC TTACTTTTTT TAGTCCATCT TATATTTAGT AAAAATAGCA 540^ 

ATAGTAACTC CGGTTTGGAT ACAAAATACA TTCTCACCTA TACTGCCATC ATCAGTTTTT 600 
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TTCTTTCTTG AACTATCGTC^^AAATTTAAT ATATAAATTT CATCAAATG^^^TTAAGAGG 660 

TAATCTCATA CCTCTGAATG CCACCTTGTC AAGGTATCCA TTTGTTTGTT ATGATACCTA 720 

GCAATCCTtC GTTAGAACTT TTAATTCTAT GTTCTGCAAA TCTAATAAAC TTAGTGCGGT 780 

CATCATTAAG TGGCCTTAAA TTTTTTTCAT TTATAAACTT ATTTTCTATT TTTTTATAAT 840 

CATTAACTAA ATTTAATATA TATTCATTAT TATTTTTTGA ATCTGAATTA TAAGGAGGAT 900 

TTCCCAGTAT GACAAGTATT TGCTTTTCTT TAGCTTTATT TGTAAGTTTA TTTTCTTCTC 960 

CAATTGCAGG GAAAATACCT TAAAAGATTT TTGATCTGAA GGGTCTGCTT TATCAATAAA 1020 

ATTAGTCAAA AATATTTATA ACTTTATGTT TTCATTATTT AAGCTGTCGC TACAAATTTT 1080 

TCTTTCAAAT ATTGACTTGG CTTTAAATGA TCAACTACAT AAGGAACCAT TAAACATTCA 1140 

AAACCATAGA CATTTTTAAG TATGTGAAAA TTAATGTAAT CTTCTTGTTT TTCAGAGTCT 1200 

ATTGGAATTT CGTTTAATAT AATTTTAATT . ACTTCAGGTA AAAATGTGCG AATACTTATT 12.60 

ACAAAATCAA ACACTGCAAC TTTATCCCTA TTTTTAAAGC CATAATTTAA TTTAATTTTT 1320 

TTAAGTGCCT TATGTAAACT GTTAACAATA AAACTTACAC CCGAATAGGA AGTGTACTAC 1380 

ACTCCTTTGG CCTTTCTTAA TTTAACATCG TACTTAGCTA GAAAATCCTC ATAAAAATAA 1440 

AGATAGGGGA TCTTTTGAGC TTGTTTTGGC TCTTGTAAAA GAAAATTCTT TAAAAAATAA 1500 

GCTCTGTATC AATTTATTTA TTACT^TTAAT AATTTCTTCT AAAATCTATC TTGGACTATT 1560 

ATATTCATTA TTTGTATCAA TATCACTAAT TAATTTTAAT ATATCTCTTA TAAGCGAAAA 1620 

GTTAGAAAGT ATAAACTTTT TAATATTATA AAAAGCTATT TTTCATTAAA TTTAAGCAAA 1680 

GACATAATTA CCTTATCTTA AACTTTTAGA TAATTATAAT TGATTTTTAA GGAAATCAAA 1740 

ATGATGCCCC AAAAGCTTTT AATAATAAAA AATT6TTATT CTTGCCAAAA GCTACTTAAG 1800 

AAAAATAGTA AAATTTGTTG TGTTGTTTAT AGT^CTAGAA ATAAATACCC CAAAACCCTT 1860 

ATAACGAGCT AATAATTGTT TTTATTGGGA GGTTATTTAG GGATTGTAAA TTTTTATATA 1920 

CAAAGCCTAA AACAAATTTT ACATTTTTAT ACTCATATCC TTTTCTATTT CTTGCTTGCT 1980 

GTTTCTTTAT AATAACGAGT TTTTAATCAA TTAAAATAAA ATTTTTCTTT CTAACATCTT 2040 

TCTTTCTTCT TTCAAACCAT CTTCitiAGACA CTTTAATTTA . TCTTTATAAC TCTTCtTTAT 2100 

CTTTTGGTTA TTCtTCtTTT TTAAATTTcT CTTACTTTTT GTATTcTTTT TCAATCTTTT 2160 

CTAATTCTTG TATtCCTTTT TTATTAACTT CTAATCTTAG ATTTTCAACA ATATTTTAAG 2220 

CTACCAGATT TTTAGATTTC TCTTGTATCT CTGCTTGGCA TCTTAAATTA ATTTCTCTTT 2280 

TATCTCTTCT TTTGTATCTA TAAAATCTAA A/^TTCTTTA GCTTGTTTTT TTAAATCTTA 2340 

TTCTAAATTT TGTATATCTA CAACTTATAT AATGTTTATA AGAACTTATT AATATAAAAA 2400 
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TAGCAGACAT AGTAAACTTT TCCTCATAAT TATCCCACCA AGCTTTAGGA ATATATTAAA 2460 

TACCTATATT TACATATATA AAGCTTAAAA GCAATTTAAT TACATTGCAC ACTATAAAGC 2520 

AAAAAAATAA AGCCCAAAAA AACTACTCCC CCCAGAGCAC AAATTCCAAA ATCACCAAAG 2580 

CAGATCACAA TAAAGACAAT TAAATGCAAA CAATAAAAAT ACAAGATATT CCAACTTTAT 2640 

TTAATAAAGT TGGAATAATT TTTTGCAACA TAAATTTTGA AAGCATTATC AAAATAAACA 2700 

TTTATTAATA AAATTGTAAA AAAGAAAAAC CGATATTAAA TACAAAGCTC AAATATCTAT 2760 

AAGTTAATTT AGTTTTACAA CAACTAGCAA TAAAACTACA TTAATAAAAT TAATAGATAC 2820 

ATTAAATTTC AAATCTTCAT TACAGACACT ATAAAACAAA ATTTTGTATT TTACTTTTTC 2880 

TTATTATTAT ATTAGTTACA ATATCAAGCA AAACATCTTT TCTATTCTAA AAAGCTCCTT 2940 

AAAAATATAA TTTACTATTA TTATCTCTTT TTTACAAACT CACATAATTC TTTATCTCTC 3000 

ATGAAAATTC TAATAGAAAT ATTCTTATTA TTTAATTTAC TTATATGATT ATTAAAATTT 3060 

AATGATTTTT TTTCTAAACA TGTGTTTTTT TATATTTTTA AATCCTAATT CCTTAATCTT 3120 

ATCAATAGAT AAAACTATCC TCCAAAACTT TTGACTAAAG TTTTAAATAA AAATAAGTTT 3180 

GCnTTTAGC 3189 
(2) INFORMATION FOR SEQ ID NO: 38: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3130 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doxible 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID, NQ.: 38: , - . 

TTGTAAAAAG TTTTGTTTGA TATAAGTTCA CTTGTGCCCT TTACTATTTT TGTAGTTGCT 60 

TTTACTTTCA GCTTCATTAG CAGTTGCAAG TTTTTTCATA CATTCATAGT AAAGCTCCAT 120 

TTCTCTTATT GAACACTCCT TTATATATTC ATCAAGCTCG CTTTTTAAAG AATTAATTTC 180 

TCCATTAACA ACTTGCTTAT TTTTTTTACT ACTTGCTTTA TTTAAAGCGT CAATTTCAGC 240 

TCTTAAATTT TCTATTTTAG TATGCATACT AAAAAGCTCA ACACTAGAAT ATTGCTTAAA 300 

TGCATTTATA AATCCTAATT CTAAATTAGC CCGCTCTAAA TCCAATTCGC TTCTAACTTT 360 

CCTAGCGTTA ACTTCTGATT TAAAAGTTTG CGACAAAAGG TGTTCAAAAG TGTCTTCACT 420 

AATTGATAAT CTAGAGTCAT CGCTAACAGA ATTTTCCCCA CTTTCCCATT TTTTCCTCAT 4&G 

CCTCCACACA TTTACCCTAG AAACCCCCAA TTTATCCGCT ATTTCCCTAT CATCTAACAA 540 
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\A^ATAATCATC AAAAGACCTT TTAACTTTT'i^^A 



TCCTTCTCTA AAATATGCAA^ATAATCATC AAAAGACCTT TTAACTTTTT^CAAAAAATC 600 

CTCTAAAATA ACAAAATTAA CAAATTGTTG CTCTAAATAG TAAAGCAATT TATCAATTGT 660 

TAACATTAAC TATTGTCTTG TTGATATCTA TTGACCACAG ATCTATCTTT ACAATTCTTA 720 

.TTAAACATGA ACCAGTATCA TTATTGTCGC CATTAAGAAG ACCCCTCATA AATTCGTTAG 780 

CATTTAAAGA AAATAAAGCA AATA.TAAAAT AATATAAATT CTTTTTATTT ATCATGATTC 840 

TCCAATATTA ATAAAATAAC AAGACTAGTA GCTAATCTTG TTATTCATAA TTTATGCTTA 900 

TAAAAACCAT TTATTTTATT TCGAAATCTT TTTTAGCTTT TCTTAATAAA TATCTTATAA 960 

GATTCTTTTT TCAAATTAAA ATCTAATCTT TGGGCAAATC AGCCAAAATT TGTTTTAAAA 1020 

TTTGTTTAAC TGTATTTGCT TTATCTTCAG AATAATCTTT TTTAAAATTA TTTCTGGCGT 1080 

TATCTCCATA TTTCTCAGCA TAATCAATTT TATCCGAATT TAATTGTATC AAATAATTAA 1140 

AAATCGAATC TGGATAACTC CCTATAAGTC TAATCATATC CTCAGACAGG AAAATACTAT 1200 

CAGTACTTAT CTTAATTTTT ATAAGATATT CAATAGCCTC AAGAGCGTCC AAAAAAACAC 1260 

TTTTTTCTTT AATTCCAATT TTTCTTAAAT CTCCTCTAAT TCTAGGAGCA TCGGAAAAAA 1320 

CATGACTTTT TTCATACTCA TTTTTAAAAT CATAATTATC TAGTCTTTTA TTTATTAGGT 1380 

TAAAATCTTC TTTAGAAAAA GCTCTTTTAG TTTCTGTATA ATTTTCTTCT ATATTTGCAC 1440 

TTAAACTTAC TACAAATAAA AACAAAAATA TTAACAGACT AATTTTTTTC ATATCCCCTC 1500 

CTAGCTTTAT TGCCTAAATT TCAGCAATGT AAATGCTAAT AAACAATAAG ACTGATTGTT 1560 

AGTCTTGTTG TTTATAATTT TTACTATCAA AACCCATTTT TTATTATTTT TTATCTTCTA 1620 

TATTTTGAGG CTCTGCTAGC TTTTCAAGTT CTTCCTCAAT ATTTTTAAGA GCATCATCTA 1680 

TAACCTTTTT TACAAAATCA TTAGTATTAG TACCATCATT AACAGAATAA CTTCCATTTA 1740 

CACCCAATTC TTTAGCATAC TTTAAAGCTT TTTGTCCAAT ATTTCCTTGT TTTTTAACTT 1800 

TCTCAGTACT TTCTCCAGTT GCAGATTCAA CTTGTTCTTT AAATTCTTGA AATTTCTTTC 1860 

TAGCCTCTTC TAATTCTTTT TTTCTTTTAT CTATTTTATC CTTTAATTCT TGAATTTCTT 1920 

TTTCTTTCTC TTCTTTTCCT TCTTGTTGAC CAGCATCTTT TGCTTGCACC GCTTTTAATA 1980 

CGGGTGTGTT ATCGTGGGAA CTTGCCGGCA ATACTGGTGG TGGATTAAAC AGACTGTTAT 2040 

TAGGATCGTC ACCTTGCATT AACTCTTTAT CTAAAAATCC TTCAACTTTT TCTTTTACAT 2100 

TTTGTTTTAA ATCTTCACTA CTCGCATCAA TCTTGCAAGA AATTATCAAA ACAAAAACTG 2160 

CACAAATAAT TAAATTTTTC ATTTTCTTAT TCATAAGTTA CTCCATAAAG TACTAAfATT 2220. 

ACCACAACAC CAAATAATTG CAATATTTCA AAGATTTAAA TATATAATTT TGTTACATTC 22 80 

AGCTGTTACA TTTTAACAAA ACACAAATGT AATTTTAACC AACTCGCCAA AATCTCTCCA 2340 
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TTGCAAATGC TCTACTCATT ACAAAAGATT ATAAAATACA TACAAATTAA ATTTTCAAGT 2400 

CTTTGCTATA TATTACACAA AGTATACTAT CTTTCTTGTG TACCACCCTC AAAAATCACT 2460 

ACTTCTGTTT ATTACACCCA CTCTACAGCC CAGATTTTGC ATGCAATGAG AACACTCCAA 2520 

ATTTGACTAA AATTTTTCGT TTTTAGTAAA ATATAATTTA CATTTTTTAT CTATTTTTAT 2580 
TACTTTTACT : TAATTTAAAA GTAACAACTT CAAGGAGAGG ATTTTATGGA CAATAATAAT ' 2640 

TCTTTTAATT TAAATAATTT CAATATGGAT TTTACGCTCA AACTATTTCA AGAATACCAA 2700 

AAACTAATAA ATGAAAACAA AATTCTTAAA AATTCACTAA AAAATTCATC TAAAAGTAAA 2760 

AAAGAAAATT CAAAACCAAC TCCTAAGTTT TATTTAACCC CTAAAAGTAT TAAATTAATT 2820 

CTAAAATGTG CCAAAACCTT AAAACAAATT GACCCAATTT CTGGTTGGTT TGTGCATCTA 2880 

CTCTTAATAA GTGGATGTAG AGGCACTGAA ATGCAAAAAG TAAAAATGCA AGATATTTCA 2940 

AGTTTTTTAA GCAAAACCGG AAAAACTTTA TATACTATTA AAGTAAATGT GGCAAAAAAA 3000 

AGAAATACCT CTTGTATTAG AGAAATTGTC ATCAACTCAG AAGAGTTCGA GGCTATCCAA 3060 

ACAGCACATA AAAATCATTT CCAAGAAAAA ACTCTTGACT CAAGGCGTAC TTATCTTTTC 3120 

CAAAAGAGCA 3130 
(2) INFORMATION FOR SEQ ID NO: 39: . 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3029 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

. . Cxi X ,SEQUEa?CIiL. DESCRIPTION: SEQ- ID NO: 39: .... . 

AGTTTTCCCA TTTCGCTCCG TAACTTGTGA TTACACTATC ATTTGmGwcy CCTGATATkT 60 

cTGTGGAkaT TATTGTTgAA GmTTTTCCtC TTTTcCTCCT TATTTTGTAa TAAaTAtTAT 120 

ATgCAAAAAC TATTTTTGCC AACTTTTTTA CAAAAAATTT TACAAAAAAT TAGTTGGGCT 180 

TATTTAAATT CTCTTiGTTAA AGAACTTAGC TAAACCCAAC TTAATTGGAT TTTTTTGATA 240 

GCAATATATT TTTTTAGTTA TACATATACA TATGTATAAC TAAAACTATT TTTGTCAGGC 300 

TTTTTACAGA AATTATTATA ATAAATAAAA GCTTTATTAA ATTCTCATGT TAAAGAGCTT 360 

AATAAAGCCG CGGGCTTAGC TTAATTTATT TTAGATAi\AC TCACTAAACA ATTAAA.TTCA 420 

GTTCAATTTA GAATTAAAAT TATTTTGTAT TTATTAAAAT AAAAGAACCT ATTTAAATTA 480 

TCTTGTTAAA AAATTCAAAT AAGTTCTACT TTAGAGCTAT ATACTAACTT ATTACTTTAT 540 
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AAAATTTTAA TCATTTTCA^^TGAAAAAAC ACTTATTAAA TATAGAATA^&AATTGGGG 600 

CAAACGTTAT TCCCATTATT AGAATTACTT GTATTGTTCT ATTGCTTGCA TTAAGTTCAT 660 

TTTTTTAAAT ATCTATTTTA TTGTCTAGAC TAGATATATC TTTTTGCAAA GTTTTTTCTA 720 

CACTATCTAT TTTAGTATTT ACACTATCTA TATCTTTTTG AAAATTCTTT TCTACATTAA 780 

TTATTTGTTG TTCTAAAGAA TTCATTTTCT CCTTTAAAAC TTCAAAGTTG TAATTGTCGT 840 

TCTGAAGTAA AACAAAATCT ATTGCCTCTT CACTAAACCC CTTATTTAAA AATTCTAACC 900 

TTATATTTTC TATTTTAAGA GCATTGTAGG CTAAATTACT CATAAAATCC CCTTTATTAT 960 

CCTTTTAATT CTTTATATTT TTTTAAAAGT TTATTAATCA AATCTTTTTG ATTTTCAAAA 1020 

ATCTCGTCCA TCATAAAACT AGTAAATTTG GCATTTTTTT TATAAAAATT ATAACTTTCC 1080 

TGTTTTTTAA GTTGAAATCT TAGGGGTTTT ATTGGATTTT GCTTTGACTT ATCCTCTTTA 1140 

ATTTCTACGT TTAATATATT TCTATATACA CCCTTTAAGC CTTTTTCTTT AATATCATTT 1200 

ATTGATATGC TCCCCTCTAA TACTTTTCTA TAAATTTTAA GGTATAAAAA AGCCTGACTT 1260 

CTAGATATTA TAAATTCTGA CAAAAAGTCT TCAAATTTTT TATAACCATC AATCAAATAA 1320 

AGTTTTTTTT CTCTTATTTT ATATAGGATT TTCATTGTTT TAATTTTATT CTCAACATCA 1380 

TCAACAGTAA TTCTACGAAG TTGATCCTTA TAGCTTTTAT ATTCAAGTTC CTCATTTTCA 1440 

AATTCTTGAA CATCCTCAAT TCTATTATTT AATAATATTT TTTTTACTTT TAACTTTGAG 1500 

ACTTAATCCT CCTAAGTTTC TGATTTATTT TTAAAAGTCT TCCGGAAGAC TTTTAAAACA 1560 

TATTGTTTAA TATTTTTTTT ATTTCTTGAT AATAAATTTC TTTATTATTA GGCTCTTTCA 1620 

ATTCATTTAT AAAAACCTTA ATTGAATTAT AAA/yVTGAAC TCTTCCTTTA ATAAGATCTT 1680 

TGTATTCTGA CTGCAAAATA CTTTCAATAT CTTTATACGT ATTTCTATTT TTTATAAATT 1740 

GATTTTCTAT TATTAACACA TCAATATTTT TCTTTCTTAT TATTTCAACT TCCTTTATTT 1800 

CATTCATTAA TATTGGCAAA GACTCTACAG ACCACCTTTC TGCTTGAATA GGTATTATAA 1860 

CTTTATGTGT AATGTTTAAC GCATTAAACA ATAAAGAACT TAAACTAGGG GGAGTATCAA 1920 

TTACTACATA ATCAAAATTA TAATAATGTA AATTTTTATC AAATATATGT TCTAACATAA 1980 

GCTCTTTATA AGGAATATCT CCTTTTTCAA ATTTACATAA T^TTGGATGG" GCCGGAATAA 2040 

TATACATATT ATTATTTATT GAATTTATAT ATTCATTAAA AGCAATGTTT TGATCTCTTT 2100 

TTAAAAGATA ATAAACATTA TTCAATTCAA TATTTCTQAT ATATTGTAAA AAATAACTGG 2160 

TTAAACTATT TTGAGGATCT AAATCTACAA TCAAGACTTT ATTGTTCATT TCGCTTAAAA 2220 

TATATGAAAA TATAATTGAC AACATGCTTT TGCCAACACC GCCCTTAATT GACGCTATTG 2280 

TTATTATTTT AGGTTTTTTA TTATCCATTT TATTAACGGT CCTTGTTCTG GGTATTTTTT 2340 
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CCCATAAAAT TTATATACTT GTTGTTCTAA ATCTGTAAAC 
GTAATGATTA TTTGTTCTTT TTTTATCTAA TAATCGATAT 
TACACTTCCG GCTTTAAATC TAAATTCCAT ATAATATGCC 
TCTAGTTCCr TTTATTTkAT ACTTTATTAA wGGyTTTTTn 
AAAAATACCA ATAAACTTAT CTCCTTCTTT AATTGGGTAy 
yCTTTCCCCA TTAAATAGGG CCCTTAATGA TAGTCTAAAT 
TCCAAATTTG TAAATGTCCA TCATTATTTT TGTATGGTAC 
TTCAATTAAA ATAAAGCGTT CTTTATTTTG ACATTCAACT 
AGTTTCAATA GGCTCCATTG CACTTTCCAT ATTTAAATCC 
ATTCTTCTGT . GGTTAAAGAA TTTTTTTGTT TTCTTATTAT 
ATGTACCAAA TACTTTATTG TATTCTATTT TCTTTTGGTT 
TTGGCTTTAG AATTTCAATA TTTgTTTCC 
(2) INFORMATION FOR SEQ ID NO: 40: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3000 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATACTAAATA 
AATCCCTTGA 
CTTGCTAATG 
ATTGGTTTTC 
AArTGAGTTT 
TCATGTTTTT 
ATTGCTTTAC 
TTACATTTGC 
TCATATAGCC 
TTCCAATAAT 
ATTCAAATAT 



AAACTTTGTT 
AATAGCAAAA 
CATATGCTTT 
TrTAGCCATA 
CTTCAACAAT 
TTTCATATAC 
CATTTTCTTT 
CCTTTTTTAT 
TTTATGTTAA 
TCAAGATAAT 
TTTTTGGTAA 



2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3029 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40: 

CnCACAGnAC CTTTTAAAAG AGTATTCTAT TTTCTTAATT TATAAAAAAA TAAAATCAAG 60 

.GTAAGAACTA^TTTAAAATAA ATCTTGTGAA TCTTTAGTAG TGAATGATTG ..TCTGTCCTAG ^ 120 

TAACTTAGAA CTTAGAAAGT TAGCAAAGCA AACTTTCCAT CCTTCTTCAT CTCATTACCA 180 

AAATCCGCAT. CCTCATCACC CTTTCCAATA GCAGCAGCAA TCGGATTTGT AGCCTCCCCA 240 

GGCTTCTCTC CATCCTGCTC AGCCTCACCA GCAGCCTTAA CAATCGCACT TAATATCTGC 300 

TCCCCACTAA CAGCACCAGC CGCCTTGCTA GCAGCCTCAC TGTCCCCAGC ATTAGCATTA 360 

TCAACTTTCC CAAACAACTT CCCTGCCTTT TTATTATTCT CCCCTGCAGC AGCAGCAACT 420 

TTCAGCTTTT CACTCCCCCC AGCAGCTTCA ACAATCTCCT TTATTCCCTT AGCAATCCCC 4 80 

GTCACACTCG CCTCATCAGC AGCCJTCGCA GCACTATTAT CAGCCACAAC TTCTCCAATT 540 

GCATCAGTAC CACTTGAAGC CCCCTCAGCT GTCTTTACAC AGCTTTTACC AGCTTATCCA 600 

ACAACTCGCT AACTTCTTTA ATAGCCCCCT CAGCCTTCTC TTTCTCACCA CCACCACTCT . 660 
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TCACAGCAAA CTTTCCATCC^HaGCCATCC CCCTCAAAGC AATAGCAGC^^SaATCTGAT 720 

CATCCTTCTT CATCTCATGA TTAAACTCCG CACCCCCATC TTTATCCCCA ATAGCAGCAG 780 

CAATCGGATT TTTAGCATCC TCAGGCTTCT TTCCCTCCTG ATCAGCCGCA CCAGCAGCCT 840 

TAACAATCGC ACTTAATATC TGCTCCCCAC TAACAGCACT AACAGCACCA GCCGCCTTGC 900 

TAGCAGCCTC ACTGTCCCCA GCAGCAGCAC CAGCCTTCCC AAACAACTTC CCTGCCTTTT 960 

CATTGCTCTC CCCTTTAGCA GCAGCAACAG CTTTCAGCTT TTCACTACTC CCCCCAGCAG 1020 

CTTCAACAAT CTCCTTTATC CCCTTAGCAA TCCCCGTCAC ACTCGCCTTA TCAGCAGCCT 1080 

TCGCAGCATT ATTATTATCC ACAACTTTTC CAATTGCATC AGTACCATTT Gi\AGCCCCCT 1140 

CAGCTGTCTT TACAGTTGTT ACCAGCTTAT CCAACAACTC GCTAACTTCT TTAATAGCCC - 1200 

CCTCAGCCTT CCCTTTCTCA CCACCACTCT TCACAGCAAA CTTTCCATCC TTAGCCATCC 1260 

CCCTCAAAGC AATAGCAGCA GCAATCTGAT CATCCTTCTT CATCCCCTCC TTATTAAACT • 1320 

CCGCACCATC ATCCGCATTA CCCTTCCCAA TAGCAGCAGC AATCGGATTT TTAGCCTCCT 1380 

CAGGCTTCTT TCCCTCCTGC TCAGCCGCAC CAGCAGCTGC AGCCGTAACA ATCGCACTTA 1440 

ATATCTGCTC CCCACTAACA GCACTAACAG CACCAGCCGC CTTGCTAGCA GCCTCACTGT 1500 

CCCCATTAGC AGCATCACCA GCTTTCCCAA ACAACTTCCC TGCCTTTTTA TTATTCTCCC 1560 

TTGTAGCAGC AGCAACTTTC AGCTTTTCAC TCCCCCCAGC AGCTTCAACA ATCTCCTTTA 1620 

TCCCCTTAGC AATCCCCGTC ACACTCTCCT TATCAGCAAC CTTCGCAGCA GCATCATTAG 1680 

CCACAACTTC TCCAATTGCA TCAGTACCAC TTGAAGCCCC CTCAGCTGTC TTTACACAGC 1740 

TTTTACCAGC TTATCCAACA ACTCGCTAGC TCCCTTAATA GCCCCCTCAG CCTTCCCTTT 1800 

CTCATCACCA CTCTTCACAG CAAACTTTCC ATCCTTAGCC ATCCCCCTCA AAGCAATAGC 1860 

AGCAGCAATC TGATCATCCT TCTTCATCTC ATGATCAAAC TCCGCACCAT TCTCCGCATC 1920 

ACCCTTCCCA ATAGCAGCAG CAATCGGATT TTTAGCATCC CCAGGCTTCT TTCCCTCCTG 1980 

ATCACCAGCA GCCGCACCAG CAGCCTTAAC AATCGCACTT AATATCTGCT CCCCACTAAC 2040 

AGCACCAGCC GCCTTGCTAG CAGCCTCACT GTCCCCAGCA TTACCAGCAT CAACTTTCCC 2100 

AAACAACTTC CCTGCCTTTT TATTATTCTC CCCTGTAGCA GGAGCAACTT TCAGCTTTTT 2160 

ACTCCCCCCA GCAGCTTCAA CAATCTCCTT TATCCCCTTA GCAATCCCCT TCACACTCTC 2220 

CTTATCAGCA GCCTTGGCAG CAGCATCATC AGCCACAACT TCTCCAATTG CAGCAGTACC 2280 

ACTTGAAGCC TCCtpAGCTG TCTTTACAGC TGTTACCAGC TTATCCAACA ACTCGCTAAC 2340 

TTCCTTAATA GCCCCCTCAG CCTTCCCTTT CTCATTATTA TCCTTCTTCA CAGCAAACTT 2400 

TCCATCCTTA GCCATCCCCC TCAAAGCAAT AGCAGCAGCA ATCTGATCAT CCTTCTTCAT 2460 
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CTCATCCTTA AACTCCGCAC CATTCTCATT ACCCTTCCCA ATAGCAGCAG CAATCGGATT 2520 

TTTAGCCTCT GCAGGCTTCT TTCCCTCCTG CTCAGCCGCA CCAGCAGCCG TAACAATCGC 2580 

ACTTAATATC TGCTCCCCAC TAACAGCACT AACAGCACCA GCCGCCTTGC TAGCAGCCTC 2640 

ACTGTCCCCA GCATGAGCAG. CATCACCAAC CTTCCCAAAC AACTTCCCTG CCTTTTCATT 2700 

GCCCTCTTTA GCAGCAGCAA CTTTCAGCTT TTCACTCCCC CCAGCAGCTT CAACAATCTC ' 2760 

CTTTATCCCC TTAGCAATCC CCTTCACACT ATCCTTATCA GCAGCCTTCG CAGCATCAGC 2820 

CACAACTTCT CCAATTGCAT CAGTACCACT TGAAGCCCCC TCAGCTGTCT TTACAGCTGT 2880 

TAcCAGCTTA TCCAACAACT CGCTAGCTCC CTTAATAGCC CCCTCAGCCT TCCCTTTCTC 2940 

ATCATCATTC TTCACAGCAA mCTTtCCATC CTTAGCCATC CCCCTCAAAG CAATAGCAGC 3000 

(2) INFORMATION FOR SEQ ID NO: 41: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 2991 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41: 

GAGAAAAAAC ATGAATTTAG ACTATCATTG AGGGCCTTAT TTAATGGAGA AAGAATTGTT 60 

GAAGAAACTC ATTTGTACCC AATTAAAGAA GGAGATAAGT TTATTGGTAT TTTTTATGGC 120 

TACAGAAAAC CAATAAAAAA GCCATTAATA AAGTATCAAA TAAACGGGGC TAGAAAAGCA 180 

TATGCATTAG CAAGGGCATA TTATATGGAA TTTAGATTTA AAGCCGGAAG TGTTTTTTGC 240 

TATTTTAAAG GGCTaTATCG ATTATTAGAT .AAAAAAAGAA CAAATAATCA TTACAACAAA 300 

GTTTTATTTA GTATGTTTAC GGATTTAGAA CAACAAGTAT ATAAATTTTA TGGGAAAAAA 360 

TACCCGGAAC AAGGACCGTT AATAAAATGG ATACTAAAAA ACCTAAAATA ATAACAATAG 420 

CGTCAATCAA GGGCGGTGTT GGGAAAAGTA CGAGTTCAAT AATATTTGCG ACATTATTAG 480 

CTCAAAAATA TAAAGTATTA TTAATAGACC TAGATACTCA AGCATCTACT ACCAGTTATT 540 

TTTGTAAAAA ACTTGAAAAT CAAAAAATTG ATCTTGTCAA TAAAAACATA TACAGAGTAT 600 

TaAAAGATAC ATTAGATGTA AATAATGcAA TTGTAAATAT TaAAGAGaAT TTAGaTTTAA 660 

TACCAAGTTA CATAACTTTG CATAAATTTT CAAATGAATT TATACCCCAT CAAGAGTTGA 720 

GATTAAAAGA TAGTTTAATC TTTTTAAAGC AAGATTATGA TTATATAGTA GTAGATACTA 78^ 

ATCCTAGTTT AGATTTTACT TTATCAAACG CTTTAATAAC TAGCAATTGT GTAATAGTTC 840 
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GgCAATAGAAA GTTTAGATTT ATTAGAATT'I^A'] 



CAATGACGGC AGAAAAATGG aCAATAGAAA GTTTAGATTT ATTAGAATT'I^ATATTGAAA 900 

ATTTAAAAAT AAAAATACCA ATTTTTCTTC TTGTGACAAG GTTTAAAAAA AACAATACTC 960 

ATAAAGAATT ATTAAAATAT GTTGAATCTA GGGAAAGATT TTTGGGATTT ATTCATGAAA 1020 

GAGAAGATTT AAACAAAAAA ATTGCGGGCA ATAATGAATT CAATATGGAT AAAGACTATA 1080 

TTAATG7VATA TAAAGAAGCA TTATCAAAAT TTTTTGAGAT ATATTAAAAA ATTTATTATA 1140 

AAAAAAATCC AGATTCTGGA CTTTTTTGAA ATAAAGGAGA TTTTTTATGA AAATAGAATT 1200 

AAATAAAAGA ATTTTGGCAT CAGGGATAGA TCCCGATGGT AAAAAAGAAG TGATTACCAA 1260 

TGAAGATAGA ATTGCTCATT ATAATGCTTT GAAAGATAGA TTAAAGGCTA ATTTTAGAAA 1320 

AGAAATATAT CATAAATTGG ATAGCATCAA AATTTTGAAA GAAATAAAGG ATAATCAATA 13 80 

TTATAAAATT. GATGGATATA AAAAATTTGA CTATTTTATA AAAGATTATA AAATAGCTAG 1440 

AAGTCAAGCT TATAATTACT TAAAATtTAc AACTGCGTTG CAAGAAGGAA TTCTTAAAGA 1500 

AGATTATTTA ATAGAAAATG GCATTCATAA TTCTCTTGAT TTAATAAAGG ATAAAGAAAG 1560 

TCCAACATTA AAAAAGTCTA AACAAAATCC AATAAAACCT CTAAGATTTC AACTTAAAAA 1620 

TCAAGAAAGT TATGATTTTT ATAAAAGCAA TGCTAAATTT ACGGGATTCT TGTTAGATAA 1.680 

ATTATTTATG GATAAAAAAG AAATAATTAA AATAATTATG AAAGAATATA AACAATTAAA 1740 

GGGATAATAT GGAGGTTGTA TGAACAATTT AGCTAACAGA ACGTTTAACA TAGGAAATAT 1800 

AAAAAACGAA TTTTTAGAAA TAGGATTTAG CGAAGAGGcA ATAGATTTTG TTTTTCTTCA 1860 

TAATGATAAT TATAACTTTG AGTTTTTAAA AGAGAAATTG ATTAATTTAG AGAAGAATTT 1920 

ACAAAAAGAT ATATCTAATT TAGATATCAA AATAAATAAT GTTAAAAACG AACTTAATGC 1980 

TAAAATAGAT AGTGTAGAGA AGAATTTACA AAAAGATATA TCTAGTTTAG ATATCAAAAT 2040 

AGATAGTGTA GAAAAGAATT TACAAAAAGA TATATCTAGT TTAAACACCA AAATAGATAG 2100 

TGTAGAAAAG AATTTACAAA AAGATATATC TAGTTTAAAC ACCAAAATAG ATAGCGTAGA 2160 

AAAGAGTTTG CAAAAAGATA TATCTAATTT AAACACCAAA ATAGATAGTG TAGAAAAGAG 2220 

TTTGAATCAA AAACTTAGCA TGGGTAACAG ACTAGTACAT TTTATGATAA TAACAGCAGC 2280 

AATTCTAGGT CCAATTTTAA ATGCCCTATT TATGAGGTAT TTACAATACA TCAAATAATG 2340 

ATGTATTGTA TAATTTGATT TTTAAAATGG TACATTATAA TATTGATGAA GAGTATTATT 2400 

AATTAACACT TAATTTTTGC TTTTTCATAA AGTAGAACTT ATTTAAATTT TTTAACAAGA 2460 

TAACTTAAAT AAGTTCTTTT ATTTTAACAA ATACAAATTG ATTTTAATTC TAAATTGGAC 2520 

TATACTCAAT TATTGAAAAG. CTTTTTAAAA TTATTTTAAT AAGTGAATTC GGTTAAACCX: 2580 

TAGCTTTATT AAGTTCTTTA ACAAGAGAAT TTAATAAAGG TTTTATTAAT TATAATAATT 2640 
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TCTGTAAAAA GTTGGCAAAA AACAATTTAT AATATTATTA TAAATATTAT AGGAGGGATA 2700 

TGTTATTATA AATCCGATTT AGTTTGGGCT TAACTAAGTT CTTTTGTTTG AGAATATAGT 2760 

TAAGCTCTTT TTTTTATAAA AATTGTTATA AAAAGTTGGT AAAAATAGTT TTTGTTATAT 2820 

ATATGTATGT GAATAGCTAA AAAAGTGTAT TGCTATCAAA ACAATCCAAT TAAGTTGGGT 2880 

TTAGCTAAGT TCTTAGACAA GAGAATTTAA ATAAGCCCaA CTATTTTTTT TGTAAAGATT 2940 

TTTGTAAAAA AgTTGGCAAA AATAGTTTTT GCTATATACn TATATTTATG n \ 2991 



(2) INFORMATION FOR SEQ ID NO: 42: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2988 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42: 

ATTGCGAGCA TAATATGTGT TTTTTTATTT TAGCACAAGT TTTTTAGACT 60 

GTTAAAAAAA AAGAAGATGC TGAGTAATTT GTATAGTTCT TTTAAGATTT 120 

AATAAATTAT ATTATCTTGA TATACTTCTA ATATTTACCC ATCAATAAAG 180 

TTAACAAATA AAAACCAATA AATATTTAAA AAATGATTAA TTTAGAATAT 240 

GCTAAAGCAA AAAATAAATA TAAATTT<3GA CTAGTTTTAT TACATAAAAA 300 

GTCATGCTTG TTGCAATAGA GCCTACTATC TATCCCGCGA GGTATATTTA 360 

TTTTTAGTTT TTGTAAAGTG ACTTTTAATT ATTAAAATCT AAGGAGAAGA 420. 

CAAAAAATTT TCTATTTCAT TATTATCTAC AATATTAGCC TTCTTGTTAG. . 4.80,. 

TGATTTGTCA AGCAATAATG CTGAAAACAA AATGGATGAT ATTTTTAATT 540 

ATACATGGAT AATTCAAATT ATAAATGTTT AAGTAAAAAT GAGGCTATAG 600 

TAAAATTAAA TTAGGTGTAA ATAATACTAG AAGTCGTTCT TATTCTTCTA 660 

TGTTTCGGAT TCCTATAATA AAACCTATTC ATATTGCAAA AGCAACTGAT 720 

ACAAAAAAAC AAGAGAATGC TCAACCCATA ATTAGGTGAC AATTAATTGA 780 

GGATTATTAA AAGTTAGCTT CTGTGACATT ATACACTTGA ATATAATATT 840 

AGAATATATG GGTGTTAATA AAGCTTATAA GCATAGAATA TATCATATAA 900 

CTATCCCCTT AAAGGAAGTT GATAGTTTAG CTCTTTGTAA TGTCCAACTT 96a 

CTGCGTATAA TGATTTTTTT AGAAAAATTT AAAAGGGAAA TAGAACACAA 1020 



CTATTTGAAA 
TTCTAAAAAA 
TCATTTAAGT 
CTAGTGTGGC 
AATTTCTATA 
GATAAAATTA 
TTTATATTGC 
GATTTATGAA 
TATTAGGTTG 
TAGAAAAGAA 
TTAAAAATTC 
GAGAGACTAA 
TAATTTTATT 
ATATATGCAG 
ATAAAATAAT 
AGAAGAATTT 
GACTTAGACT 
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GGATTTCCTA AATATAAAAG^KaGAAAAAT AGGGAAACTT ATAGAACTA^^^TCAAAAA 1080 

AACTCAATAG GAATAAAAAA TGGTTATATA AAGCTACCTA AAATAGAGTT TATAAAGTTA 1140 

TGTCTATAAA TATTATATTT CAATAACAGT TGAGTGCTTA GATACTAAAA ATAATAATGA 1200 

AACTAAAGGT GATAAAAAAG AGGCAGTTGG TATTGATATG AGCATGAAAC ATTTTTTAGT 1260 

AAGTAGTGAA GGTGAGAAGA TTAATCATCC TAAATATTTA TTAAAAAATG AAAATAAACT 1320 

TAAAAAATAC CAAAGAAAAC TATCAAAAAA GCAAAAAGGT TCTATTAATA GAGATAAGTC 1380 

TTAAGGTTTA GACTTGCATT TATATCTCCA TCATGCAAAG TTGTTACAAC TACTGAAAGC 1440 

CCACCTAGTA TCACTTAATT TTAGAGCCAT ATTTTTAATA TGACAACTAC TACATACATA 1500 

TAAATCAAAA TGGTATGGAT CTGCTTTGTA TAAAGTAGAT AGATATTTTC CATCAAGTAA 1560 

ACTATGTAAA TTGTCTTGCA AACTCAGACC ATCCTAAATC ATTAATACTT TTTCCAAACA 1620 

TTCCTTTTCG CATGCGTTTT TTCATTCTTA GAATTCGAAC TGTAATCAGA CCTTTATATT 1680. 

CTTTATCAAT TATCATATTT TAGATTTAAA TTGTATATAG CAAAAAGGTC CTATATGGGC 1740 

TATTCCGTTT GCAGTAAATA AATAGGGATT GrGAATTAAAT CCCTAACCTA ATTGAATAAT 1800 

ATCATACTTT CTTCAAGAGG ATTCCCTTCG GCCACTTTTT TTCTTCGTTC TTCCATTACT 1860 

TTTTTATATT TTTCAGCTTG TTCTCTTCTT TTTTTATTTA ATTCTGTCGA TTCTCTTTTC 1920 

TCTTTTTATA ATTTTTCTTG AACTACTAGT GGCTTAACTG TTTAGATTTG GGATCGTCCT 1980 

AGTTATAATT TTGGTACTTC TAATTTTTCT GCTACCACCT TTAATTCTGC CTCTAGATTT 2040 

GCTCAAATTT TAGGGATTGA TTCTAATTCA TCTCCTTTTA AAGATTTTTT TCTTCTACTT 2100 

TCTTTCCCTT ATGTGCTTTT AAATCAAATC TTTTTGAATT ATCCATAGCT TCTGTTGCTT 2160 

TTCATATACT GTTGTATAAT CTAGTGTCAT TTTATTTGGA TCCATTTTAT TTTTAGATGA 2220 

TAACTTTTCT AACTTTTTTT ATTATCTTTA TCTTCTTTTT TTAAATCACA CGAAAATAGT 22 80 

AAAAATAATA GCAAGTAATG GCTAGGCATA TACTTATCTA ATTTAGAGAT TAGCTCCTAT 2340 

ATTC7VAGCGG CTATTATCCT TATTCTTCTG GCATAGAAGT TGAAAATTTA AATTTTAATA 2400 

AATTGTATTT TTATTTTAAT GAGAATAAGC AGAAACATTC CATTCTTAAT TGAATTCATT 2460 

AGAAAGTTTC CTTCTATTGC TAATATCATT AATATAATAA AATAATTATC AAAAACATTA 2520 

GCAAATCCCC CTTTATCTCT ATGATACTCC TTCACATCTA TATGATTTCT ATCTTTACTT 2580 

TCTACATTAG GCTGATTATC TCTACCATAT TTAATATAGC TAAGCGGCTT TTTAACTTTA 2640 

CCCATATTTT TCAGTTTGAA TAAAAACCTT TTAACATACT CTTCTATTTG GGATACATCT 2700 

CCTTTTCAAT AAAAATTAAA ATGCGCTGAT TTTAATACAT TTACGAAAAA AGTTAATGTA 2760 

TCGAGTTTTT CATTACTAAA TCTAAGATTG CTTTTCTAAC TCAGTTTTAA ATTAATACTT 2820 
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TCATAAGCTT TACAAGCTTT AGTCACTCCT CATATAAAAT CCAAAATTCA ATTGTTTTAT 2880 

ATAAGTT^GT ATCAAGTAAA TTTAAATTGG ATAGTAAAAT ATTAAATAGG GGAAAAAACA 2940 

AGCTTAATAT TGAGTGATAA ATAAATTTTT CTCTTATTAA ATAGTATA 2988 
(2) INFORMATION FOR SEQ ID NOj 43: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2970 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43: 

AGAGTTTTTT CGTTCTTTAA AGTACTTGTT GATTTTCTGG TAACATTCTT TTTTAGGATA 60 

CTTTAGCTTA TAGTAAATTT CAGTtCCACA ATTTACACCC ATGTGTTGGT AGTAATTCGT 120 

TGTGACTTTT AATACTTTTT CTAATTTATA AAGATAATTT TgCaTTGTTC TCAGTGTAGT 180 

GGGAGCCAAA CCATTTCTTT TTAGATTTTT ATTATAGTAA TAGAGTATGT TTTGTTGTGT 240 

ATATTTCTTA TCTTTTTTGT TTAGAAAATC TACTGTTGAT GTAAGATATA TTAACTTGTG 300 

TTGGTGTTTG TTGTGGCAAG TGGGATTTTT TGTGGTGATT AAAAAATCTT TCATTTTTTA 3 60 

CTCCTTATTT TGTTATTAAC AATTACTATT ATAATGCAAA ATTTTGATTT AAAAGTAAAT 420 

ACTTTTCTAA AAAAATATTA AATTTTAATT ATTAATCTTA TTAATTAAAT ACACTTTTTG 480 

TAATTTGGTA AAAAGATTTA TTGATTTTAA TCACAAATTA GACTATACTG CAT^TAGCGT 540 

AGGAAAATAT CTTCATATTT TTACCTACCT TATTTTGTAG TTTTCTAAAA TCATAGTGGG 600 

.aACTTGGCGA AATTCTTTTT AAAGGGAATT TGGTTAAGTC CCACTTCTTT TGTGT.\?sjlAT 660 

TTTTTGTAAA AAAGTTGGCA AAAATAGTTT TTGCTATATA ATTATTTATT ACAAAATAAG 720 

GAGGAAAAAG ATGGAAAATC TTTCAAACAA TAATAATCCA CAAGAAAATA TTCAAGGAGA 7 80 

AATTAAATTC AGAAAAGATA TGAGCACCCT AATCAGAAAC TTGCCGCGTA TTGACAAAAG 840 

TCTTAAAGGG TATGGGTATA AGTATCAAGA TTTCAATGAC ATAGTAGAAG TAATTTATAG 900 

TGTTATTGAT AAGCATAATT TGGATCTTTT TTTTACGCAA GCCCCAATTT CTGTAGAGGG 960 

GCAATATGGC ATAGTTGATT ATATTAGGAC TACATTCTAC AGTACAAGCA CTGTGTACAA 1020 

ATACTCATTT GATACGCGAA TTCATACAGA TAAATTACAA TGGAACAGTG AAAATGGGTC .1080 

TAAAAATATG AATACGATGC CACAATTTGT TGGATCAGCT ATTACTTATT TCAAAAGGTA 114-0 

CGCTTTAGTA GGGCATCTTT GCATAAGAAG CGAAATGGAT ACTGATGCAG CACCTATTTA 1200 
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^AATTCTATGCC TAGCAAACAA TCTAGTGTTAATC 



CAATAATTAT GAAAACAGAA ATTCTATGCC TAGCAAACAA TCTAGTGTTA ATCAAAAGCA 1260 

AGAACAAAAA AGAGAGCAAA AACAAGAGAT TAATCAAAAT CAAAAAAATA ACACTATTCA 132 0 

AAACCAGAAA AGAGACATTA AGCAAGAACA AAAA/^GAT AGGTTTTATT ATTACGGTGT 1380 

TTTTAAAGAA GCGTTGTCTA ATATAAAAGA TTGGGTAAAT AGCCCTACAA TAAAAGATAA 1440 

TATAAACTCA ATTAT.TCAAA AAATAAGCTT TATTCAGAAT ATAGACCCCA ATAATGTTGA 1500 

TGATATCAAG AAAATTGAAT CTGATTTAAT CTCGTATTTT GAGAAAAATA GTGATTTTAA 1560 

AAGTATAAAC TATTGGGCGG AGATTATAAA AAACTATTTC AAGAAAAATA ATAGATTAAA 1620 

GGATTTACAA GATTTTGAAA AGTTTGTGTC GTTTAAGAGG ACTGCTTATG GCCCTAGTCC 1680 

ATTAATATTC TTTAGTGTCT TAAAAGAATA TGAACGGTTT GATTGCATAT TTGCAGCATA 1740 

GCGAATTCTT ATATGGTGAA GCCCCCACAT GGGGGCTGCG ATATTATTGC TGAGCTTGGC 1800 

AGGTACTACT TGCACTAGTT GCAAAACTAT CTATACCGCC ACCAAGAGCC CCCTTAACCA 1860 

CCTCTTTGAA CSGTGCTTTTT TGTTGTTCAG AATTATCCCC AGTACACTTA TCAAGTTCAC 192 0 

TCTTTATATG ATTAAGTGCA CCTTTTATTT TGTCTTCGTC ATATCCTAAA AATTTATCAA 1980 

ATTCTCCAGC ACCAGTTAAA GCGGTTTTTA ACCAGTCAAG ATGTGTTTTT TGGTCTTCAG 2040 

ATAGCTTTTC TCTAAGCAGG TCTTCTTTAG ATTTTGGTTT TTCTTGTGTT GCTTCTTTTT 2100 

GGGTTAAATC ACGTTTTTGT CTACTTTTTG TTTGGCTAGT ATTAGTATCA TTAGAATTAC 2160 

AGCTGTTTAG CATTAGTAAA AATAAACAAA ATAATATGTT GATAATTTTC ATTrTTATTC 2220 

CTTTTTTTAT TATTAATATT CACTTAATCA ATTATTAATA CTAAATATTG GATAAACAAT 2280 

TATTATTTGA ATTGATATTC TTTAAGTGAG GTAGTAGCTA TTTAG/IAATG AAAGCAAATA 2340 

TTAGCCCGGC TATCATTGTT ATAGACATTG CTCCCATAAT TCCTAATACC CATTTAAGCA 2400 

TTTCTGAAAG AGACATTAAA TTCTTTTCCA CATTGTCTAT TTTAGCAGTA AGTTCATTTT 2460 

TAACACTATC TATTTTTAAA TTTAAATTCT TTTCTACAGT ATCTATCTTA GTATCTAAAC 2520 

TATCTATTTT TAGATTTAAA TTCTTTTCCA CATTGTCAAT CTTAGTATTA AGTTCGCTTT 2580 

TAACAGCATC AATCTTAACA TTTAAATTCT TTTCTACAGT ATCTATTTTA GAAATAAGAT 2640 

TATCAAATTT TATATCAAAT TGTTTTTCTA AATTTTCTAA ATCTCTATAT GTTAGTTCAT 2700 

TGTGATAATA TCTTTTAGAT AAATCTTGTG CTATTAGTTG TTCCATGCCC AGTCTAATAA 2760 
ATTCTTTATA TATTTGTTCT TGAGTTACAC CTGCAATATT TGTTGACACT GTTTCCATAA- " ' 2820 

AATTTTCCCT TATGGTCATA TTATACACTA TTTTAGATTA ATTGGCTTTA GAGATTTTTA^ , 2880 

TATGTAAAAT AGAATTTCTT GCAAGAAAAA CCTTTTTGTA ATTTACATTT TTAATTGGGA 2940 

ATATTTATTA TAGACTTTTT CCGCTATTGG 2970 
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(2) INFORMATION FOR SEQ ID NO: 44: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2942 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO:. 44: 

AGAATAGCTT GAAGTAAGGA TAAATGAAGT AGAAAATTTT GCCTGCTTAG TGCAAATTTG 60 

TCTATTCCTA ATAGCAATAA CACTTCTGAA TGGAGTTTTG TTACTAATU^G TTCTTCTTCT 120 

CCCGCAACTT GTGCTTGTAA GCTTTCTTGT TCACTCATTT TCACTTACCT TATACTTTTA 180 

ACTTTGCTTT ATGTTAACTT GCAAAATAGT TTTTCTAGTA GCAAGTAGAC CGCCTAAAAC 240 

AAAATCAATG TATGAATGAG CTACATCGGT TGAGTCTTTA TCAACTTGTT CATTCGGTGT .300 

AGGTAGCATA TACTTACTAG GTTTAAATTT AATAAGTTCT GAATTGAGTG GATAAATGAG 360 

TATTTTATGT TTTAGCAAGT TTGAAGTTTC AATGTAAACA TCTTCTCTAT TATTAATAGC 420 

CTTAATAGTT TGAATTAAAA CATCTTCCCA TTTTTCACAA CTACTTGCTG CACCCTGTGC 480 

TGCTGCGTAT GGTTTTACTA GTTTAAGTGA CGTTGCTGGG TCAACTATTA CCATCATCGG 540 

TGTGGAAAAT TCGTCGCCCA GTTCCAACTT TGAAAGTCCA GCCTCAATTT TTTCAAATAT 600 

TTTATCCATT TTATCTTTAT CACCACTAGC AACCTCTTCT TTTATCTGCT CGGGCATATT 660 

AAGCAGCCCA TACATATTTG GAAGCAGGCG TTTTTGATTT TTTCCATCTT TTTGAATCGA 720 

AACAGTTCCT GTTAGTACAA AGTGATTAAT AAGTTTAATA ATTTCACTAC TTGCAAGCTT 780 

.ATACGC-TTGAr.GCAAAAGGAA JQTAAAIJTATT ATTi?LM^TCC CCAATATATG AATGTGAAGT ... 840- 

ATAAAATTTC TCAGAAGTCT GCTTTAAATG TCTGAATTTA TACTGTAATT TCAAATAATT 900 

AAGTCTTACC ACTTCAGAAC TAAATCCAAT AGTTGAGATA GTATTAACCT CATTGGCAAT 960 

TGTTGTAGGA TTAGCATTTA AAAACGCGTC CCATTTTACG GTTTTTTGAT ATCCCATTTG 1020 

TAGATCAACA TCTTCAATTT GATCGGGCGA AAACCATTTA TACATAATAG GATCTTTAAC 1080 

TTCTCCTATG ATATTTGCCA CAGCTTTTGC ATAATAATTT TCATCAAATA ATTCCATATT 1140 

AAATCCTCCT AAATATTATT AATTTCTACT CATAGCTTTA TTCCCAAATA CAGCTACTTT 1200 

TACTAAATAA ACCTCATTGC TAATTTGTTT CGCATCAGTC AATGCTGTTG CATTAATAGT 12 60 

TGCTTTATTT GGTGCTCCAG TCACCTTTTC AAGAGCACCG TCTTTATTAA * TUU^CAAGTTT . 132-0 

GTCTTTTACT TTAACCGTAG AATCTTTTGC CACTAAATAT CCCTCAAAAT TATTGGTAAT 1380 
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TGGCACAATA GTAGCTGTTT TACTAAACTC ATCTATGTCA ATGCATATTC CATATAAGTC 1440 

TTCACCTCCA CCAGCCTCAA CATGTGGCTC ATAGTGACTT TGATTATCTT GAGCCTCTTG 1500 

AATAACTCTT TTTACTCCAC GCTTGTACGG ATACCCCAAA AATGGATGAT TTTCCAATTT 1560 

ATCAAACTTA CTAGTTCTAG TGCCTCCAGA AGCAAAAAAT TtCaCATTTT TGTCTCTAAA 1620 

TTCATTAGAA TTGCTAAGCA AACTAGCGTC ATGTTGGGGA TTTXtCATAA ACTTTTCCAG * 1680 

TTTACTTCTT TtCTCTkGAT ACTCTTTTAC TAATTGCGTT GTATCTCCCA TTTATTTACC 1740 

TCCTTTTATT CGCCCAAAGT TTAACCACCA TCAGGTATTA CTATCTTCTC AAGGCCTCTA 1800 

TTTCCAAAAA TTGCAACTTT TATCAAATTA ATAGAATACT CTTGCCTAGG ATATCTATTT 1860 

TGATCTtGAT TTCCAtCTTC GGGTGCAAAA TTGATtGTAA ATGAATCAGA TAGAGCATAT 1920 

ATGTTAATTA CGGTTGGTGG CCCACCTCCA GCCTTGATAA TT^CACCGTT ATTATTTATG 1980 

TCTAGGATTT CTCCTATTTT TATACTTGGA TTCCTTGTGA CAAGGTACCC TTCAAAATTG 2040 

TTAGTAATTG GCAATACATA CGCGGTACAA CTAAACTCAC ATACATCTAC ACATATCCCA 2100 

TACATATCAG TATCAGCTCC AACTTCyACA TATATAGAGT TCTCTTTTGG AACAAGTTTA 2160 

ACCCCACGCT TGTATGGAAA ACTATTTGCT GGGTCGTAAA GGTATTCCTC TATTTTGTCT 2220 

GTATAACTTG AACATGCAAA TGAATATGCA TCAACTCGCT CATTCTTAGA TTTAAAACAA 2280 

CTACTCAAAC CGCCAAAAAC CTTATTTTCA ATTGAACTCA TAGATTTTAC ATATTTCTTG 2340 

AATTTCAAAA GGATATCATC AAGCTCGTTA ATTGCCTCCA AATAGGGATG TTCCCCTTGT 2400 

GCATCCTCAG CTTGTCTTGC TTGCCGTTTA GCTCTAGGAG CAGCGGAAAC TTGTGCCCCT 2460 

AAATCTACCT GTGGGTCCTC AACAGCCTGA AGATTTTCTA CTTGCATGTT GCCTTTTAAA 2520 

GCCATAATTT ATTACCCTTT TATTGCTCTA TTCCCAAATA CACTAGCAAG CACTATAAAT 2580 

AAATCTTCAG TTAATTTGTG TGCCTTTGAA AGTGCTATTG CATTAACAGA TTTTTGAGCC 2640 

CCAGTGACCT TTTCAAGTTC CCCATGTTGG TTAAAATTTA ATTTATCTCC TGGATTTACA 2700 

CCATTTTGTC CTTCTTTCTT AAGCGTTAAA TACCCAGTAA AGTTATTTGT AATTGGTATA 2760 

ACAGTTGCCA TACCGCTAAA CTCATCTATA TCGGAACACA CTCCATATAA ATCGTCTCCA 2820 

CCACCAGCCT CAACTTCTAG TTCGGTTGTT CCATCTCCAA AACTAAGCTT AACACCCCGT 2880 

TTATACGGAT ACCCTTTAGC AGGGTAATTC TCTATTTTGT CTTTACTGCT AGTGCAAACC 2940 

CC . : • 2942 

(2) INFORMATION FOR SEQ ID NO: 45: '^L 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2892 base pairs 

(B) TYPE: nucleic acid 
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(C ) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45: 

GGGTCTATAA TGTCATTTAT TATTTCCTCA GTGCTTTTTC CAGTTTTTAT TCCGTATTCT 60 

TGCGCTGCTT TATAAGAGCT ATACATTTGA CTTTTTTGTT CTTGCGTTGC TTGTTCGGTT 120 

TCATAAAGTT TATTTATTGA CTTTTTTAAA TCTTCACTAA GATTATCATA AAAATTTGAA 180 

ATTTCATTAG TATGCATATT AATTATAGAT AGTATATAAA TAAACAATAT TTTGAGCAAT 240 

AGTTTTTGGC ATTTTTTAAA TGAAAGTTTT GATAGAAAAC ATTTCTATAT TCATAACAAT 300 

GAAATCTACA AAAAAATAAC AGCCAGTGAA CTTTTCTACT AGCTGTTACT TTGTATACGC 360 

AAATTTAGTT ACACCTAAAA GCATCCAATA TAATTACTGA CTGTCACTGA TGTATCCTTT 420 

AATTTCTTCA AATTTAGAAC TATCTTTAAG ATATTTTTTA ACTTCTTCTA ATTTTGATTT 480 

TAATTTTTCT AAATCTTCTT TAATTTCGCT AACATTTACA CTTTCTTTTA ACTTAGGCTC 540 

TTCGTAACCA GTATATGGTT TATTGCCTTC ATTTAATTTA GTTCTTAGCG CGTCCCTAGC 600 

ATCACTCAAT TCTTTCAATA ATTTTCCTAA TCCTTCGTCT TCTGATTCCT CTTCTAACCC 660 

CTCCCAAGTT TCGCGTATAG AATTATTGCC ATTGGTAAAA TCATCATACA CAGGCCCAGT 720 

AATTCTATCT ATAACGCCTT GTGGGCCTAC AGTCGTTTGC CATTTTATAA CATCAATATT 780 

TTCATTGAtC TCATCTATTT TAGCTATAAG TGTTTTAATT TGGTTATCAA CTTGCCTTTT 840 

TTCTTCCTCT TCTTGTTGTC GTTTTTGTTG TTCTGCCTCT TCTCTTTCTC TTTTTTCTTT 900 

TTCTGCTTTA GCTTTTCTTT GTTGCTCTTC TTGATGTCTT TTTTGTTCTT TTTGTTGTTC 960 

«.:TTCT^TTTA GCOH^^i^GCTA . ATTCTTGTTT. GTTTTGTTCG TGTATTATTT..-CTTTTTCTTT* . 1020- 

AATGTTTTCT TCTGTATTCT CTTGTTTTTC TTTATTTTCT TCAACTTTAG CTTCAGCTTC 1080 

TTCTACTTTT TTTTCTTGTT GACCATCACT TTGTTCTATT GCTTTTAATA CTAATGCATT 1140 

ATTGTGAATA TTTTCCGGCA ATACTGGTGG CGGATTTATT CCACTGCCAT TAGGATCATC 1200 

GCCCTGCATT AATTCTTCTT TTTCTTCTTC TTGTAATTTT TTTGCTACTT CATCTACTTT 1260 

TGTACCACTT GAAGCAATTT TATCCTTTAC TGGATCTAAA ATCTTATTTA CAAATCCTTT 1320 

AATTTTCCCT TCTGAATTTT GTTTTATATC TTTACCAGTT GCAAAATTCT TGCAAGAAAT 13 80 

TATCAGCGCA AAAACAGCAC AAATAATCAA TGTTTTTTTA TTCATAATTA TTCTCTCCTA 1440 

TATTTCTAAA TTCTATTTTA AATTTTTTTT* AAGCACTTCT AGTGGTATTG CATATTCAGC 150^9 

TGTTTTATCT CCCCCCACAC CGTTATTAAT TTTATCTCCT AAAAACGCAA TATGTTCAGC 1560 
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ACCATTAATA CTTTCTATTT ^TGTTATGAT CTCTTTGTTT TGGATACCAT ^TTGCACTACT 1620 

TTGTTCGTAC TTATATCCAT AATACAAACT AGTTTTAAAT GATCCGCCTT TAGTCATTGC 1680 

TTTTATAAAG TTATTAACTT CTGATTCTTT TAATGAAAAG AATGTAGCCG AATGTCCCCC 1740 

AGCGTTTAAA CCCGTATCAA TACCATTTTC TTCTTTTCTT ACAACTAAAT CTCCTAGGTC 1800 

TGTCCAGTTA CTATTATTAT CTTTATTTTT AATTTTTACA GTAAATTTAG AGAATTCTAT 1860 

TTTTTTAAGT TTTAACTCAC CATTACTTTG CTCATCATAT AAAGTATGGT TTATCTCACC 1920 

ACTACTTTGC TCATCATATG AAGTATGAAT TTTGCAAGCA CCTATAAGTA TAAAAACAGC 1980 

ACAAACAATA AACATTTTCA TTTTCTTATT CATAAATTTC TCCATAAGTC CTAATCATAC 2040 

CACAACAGCT AATAATTGCA ATATTTCAAA GATTTAAATA TATAATTTTG TTACATTCAG 2100 

CTATTACATA TTAACAAAAC TCAAATGTAA TTTTAACCAA CTCCCAAAAA TCTCTCCATT 2160 

GCAAATGCCC GGCTCATTAC AAAAGACTAC AAAACACATA CAAATTAAAT TTCAAAGTCT 2220 

TTGCTATATA TCACTTAAAG TATCATGTCT TTCTTAAGTC CACCCCTTAA AAATTGCCTC .2280 

TTCTGTTTAT CACAGCCACT CCACAACCCA AATTTCGCAT GCAATGAGAA CACCATAAAT 2340 

TTGACTAAAA TTTTAGGGTT TTGATAAAAT ATAAATTACA TTTTTATTAA ATTTTTATTA 2400 

CTTTTACTTA ATTTAAAAGT AACACTTCAA AGGAGAGGAT TTTATGGATA CTAATAATTA 2460 

TTTTAATTTA AATAATTTCG ATACAGATTT GATGCACAAA TTCTTAAAAG ACTATCAAAA 2520 

TGTATTAAAT GAAAACAAAA TTCTTAAAAA TTGACTAAAA ATTTCTTCTA AGCCTACTAA 2580 

AAAAGCTTCA AAACCAACTC CAAAGTTTTA TTTGAATCAA AAAATTATCA AAATAATTGA 2640 

AAAATGTGTT AAAACATTAA AATAAATTGA CCCAATTTCT GGTTGGTTTT TAAATCTACT 2700 

GGCAATAAGT GGCTGCAGAG GTGCCGAGCT GCAAAAAGTA AAAATGCAAG ATATTACTCC 2760 

CTTTTTAAGC AAAACTGGAG AAACTTTTTA CAATATAAAA GTAAATGTAG CTAAAAAAAG 2820 

AAATGTCACT TGCATTAGAG AAATTGTCAT AAAATCTGTA GAATTTGATG CTATTCAAAA 2880 

AGCTCACGAA AA 2892 
(2) INFORMATION FOR SEQ ID NO: 46: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2849 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: lineaur 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46: 

GCTAGAAAAG CATATGCATT AGCAAGGGCA TATTATATGG AATTTAGATT TAAAGCCGGA 60 
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AGTGTTTTTT GCTATTTTAA AGGGCTATAT CGTTTATTGG 
CATTACAACA AAGTTTTATT TAGTATGTTT ACGGATTTAG 
TATGGGAAAA AATACCCGGA ACAAGGACCG TTAATAAAAT 
TAATAACAAT AGCGTCAtTA AGGGCGGTGT TGGCAAAgCA 
ACTCTATTGT CTCAaGATtG GAAAGTGCTT TtAATTGATA 
ACTAGTTATT TTTACAAAAA AATAATAGAA GATAATTTTA 
TATGAAGTTT TGAAGGGGAA TGTATTAATT GATAATTCAG 
TTAG7«:TTGA TACGTAGTTA TATAAGTTTA CACAAATTTA 
AAGGAAATTA AACTTCAAAA ACAGCTATTA AATTTACAAT 
ATTGATACAA ATCCCAGCCT AGATTATACG CTAACCAATG 
ATAATAGTTC CAATAACAGC AGAGAAATGG GCTGTTGAAA 
TCAATTAGTG ATTTAGCCAT TGATATTCCA ATTTTTTTAA 
AATAATACCC ATAAGGCACT ATTTAGTTCG CTTAAAGACA 
ATTTATGAAA GAGAAGATTT AAATAAAAAG ATAGCAAAAA 
AGAGATTATA TGCTAGAGTA CAAAAATATA TTAAGTAAAT 
AGGTAACTGG ACATGATTGC CATTTTAAAT GAAAGGAGTC 
AACAAAAGAA ACCTAGAAGT GCTAAATGAA GCCGAAGAAC 
AGATTAAAAT CTAGTTTTCA ACAAGAAATT TATTATAAGA 
AAAGAAATAA AAGATAACGA ATATTATAAA TTAGATGGAT 
ATCAAAGATT ATCATTTAGG AAGGAGTCAA /5CATAT6AC3? 
ATTAAAGATG GCATTTTAGA AGAAGCTTAT GTAATAGAAA 
GAGTTCTTAA GAAAATCGCC AAATGTTTTG AAAAAATCTA 
TTAAGATTTC AACTTAAGAG TCAAGAAAGT TACGACTTTT 
ACTGGATATC TTTTAGACAA ATTATTTAAT AATGAAAAGG 
AAGGAATATA AACAACTGAa AGGATaGTAA GAAGTTTTAT 
CATATAACAT AGAAAGCATA. AAAAATGAAT TTTTAAACAT 
TAGATTTTGT TTTTCTTCAT AATGATAATT TCAATTTTGA 
TCGATTTAGA AAAGAATTTG AGAAAAGATA TATCTAATTT 
TAGAAAAAAG TTTAAATCTA AAAATArATA CTATAGAAAA 
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ATAAAAAAAG AACAAATAAT 120 

AACAACAAGT ATATAAATTT 180 

GGATAATAAA AAACCTAAAA 240 

CAAGTGCAAT TATATTTACA 300 

TGGAtACACA GGCATCAGTA 360 

ATTTATTGGA AAAAAATATA 420 

TTATAAATAT TAGTAATAAT ' 480 

ATAAAGAGGC TATAACATTT 540 

CCAATTATGA TTACATAATA 600 

CTTTAGTATG TAGTGATTAT 660 

GTTTAGAACT TTTAAAGTTC 720 

TAATAACTAG ATTTAAAAAA 780 

ATAAGAATTT TTTGGGGTTA 840 

ATGATCTATT TAATTTAAAT 900 

TTATAACAAT AATCATGTCC 960 

CATATATGGA GATAATATTG 1020 

ATTACAAGAA GTTAAaGCAA 1080 

TGGAAGTTAT TAAGATATTA 1140 

ACAGAACATT TGAAGATTTT 1200 

ATTTGAAAAT AGCAAATGCA 1260 

ATGGTGTTAC AAAAACTCTT 1320 

AACAAAATCC AATAAAACCC 1380 

ATAAAAGTAA TGCTAAATTT 1440 

AAATGATTAA AAAAATTATG 1500 

GACTAATTTA GCGTACAGAA 1560 

AGGGTTTAGT GAGGAGGCAA 1620 

ATTTTTAArA GAGAAAATAA 1680 

AGATATAAAA ATAGATACTG 1740 

AAGTTTAAAT CTAAAAATAG 1800 
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?AAATGCCAAAA TAGATAGTTT AGATACCAAG ATP. 



ATTTTGTAGA AAAGAGTTTA AATGCCAAAA TAGATAGTTT AGATACCAAG ATAAATAATG 1860 

TAGAAAAAAC TTTACAAAAA GATATATCCA GTTTAGATAC TAAAATAGAT AGTGTAAAAA 1920 

ACGAACTTAA TTCTAAAATA GATAGTATAG AAAAAACCTT GCAAAAGGAT ATATCTAGTC 1980 

TAGATAATAA AATAGATGTT TTAAAAAATG AACTTAATGC AAGCAATAGA ACAATACAAG 2040 

TAATTCTAAT AATGGGAATA ACACTtGCTC CAATTATCTA TTCTATATTT AATAAGTATT 2100 
TCTTTAATTG AGAATGATTA AAATTTTTTA AAATATTAAG GGAGTATATA GCGTATTTTT * 2160 

TAAATAGAAT ACTATAATCT TGATTTAAAT TCTTTAAAgA AACATTTTAT TTTTACTTTC 2220 

TTTTAAATTT AGAACTTATT TGAATTTTTT AACAAGAAAA TCTAAATAAG TTCTTTTATT 2280 

TTAACAAATA CAAATTGATT TTAATTCTAA ATTAAACTAT ATTCAATTGT TGAAAAGCGT 2340 

TTATTTATTA TAATAATTTC TGTAAAAAGC CTGACAAAAA TAGTTTTTGT TATATATATG 2400 

TATGTGTATA GCTAAATAAG TATATTGCTA TCAAAAAAAT CCAATTAAGT TGGGTTTAGC 2460 

TAAGTTCTCT AACAAGAGAA TTTAAATAAG CCCAACTAAT TTTTTGTAAA ATTTTTTGTA 2520 

AAAAAGTTGG CAAAAATAGT TTTTGCTATA TACTTATATT TATTACTATA AAAGGAGTAA 2580 

AAAGATGGAA AATCTTTCAA ACAATAATAA TCCACAAGAA AATATTCAAG GAGAGCTCAA 2640 

AATGATAAGT ATTAATCAAC AAAGTTTTAC TGGTTGTGAA ATATTTGAGG AAAAATCTTC 2700 

TCCCATTrAA GAAAAAAGTA AATTAAGTAA GATAGGCAAG AAATTGCCAG GaATAAGTAG 2760 

TCAAGAATGT TTTAGATTTA ATCGCAATAT TGATTTTAGT GTGCAAAGAA ACAAGTTAGA 2820 

TAAATACGGT GCTAGTGAAG TAGGCAATA 2849 
(2) INFORMATION FOR SEQ ID NO: 47: 

- (i) SEQUENCE CHARACTERISTICS: 

. . ... ... (A), ,LpsrGTH:..26J2 base pairs . .. . 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47: 

AGTTGCGTAT CTTGACATAA AAAGTGAATT TGATACTGAT GCAGCACCTA TTTACAATAA 60 

TCACGAAAAC GAAAATTCTA TGTCTAACAA GCAAGTTAGT GTTAATCAAA AACAAGAACA 120 

- AAAAAAGGAC ATAAATCAAG AAAAAAATCA ACTGAACACC TTTAATAAAA ACTTAAAATC 180 

TGGCAAGGCT TATTGCTATG AAATTTTTAG AGACGCACTG TTTAATATAA AAAATTGGGT 240 

AAATGAAGGT GAAGAAAAAA ATAATATAAA TGCTCTTATT CGGGCATTAT GTACTGATAA 300 

TGATGATGCT TTAGAAGATC TTTTTGAAAA GAATGCTGAG CTTAAGAGTA TAGAATATTG 360 
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GGTAAATTTT TTAAAAAAAT 
TAAAGTATTT ATGTCTGATA 
TATGTTGAAA AAAGAAAGAC 
CCTATTTGGG GGCTGCTATA 
TTTTAGTTTT GCCAATTAGC 
yCTTTAAgGT ACtGATAAAT 
CCTCTAAAAT aTTGCyCTAy 
ATCTTGTGGA GTGTTTTTTT 
ATTTTGTGCT TTTGATTTTA 
TTGTTTTTGA ATATCTTCAG 
ATTCATGCAC CCTTGTATTT 
TAATGAAGTA AACATTTTTT 
TTCTTCTTGG CTTAAATCAC 
AGTGTCATTA TCATTGGAAT 
GTTGATGATT TTCATTGTTA 
ATACTAAATA TGGGATAAAC 
CTATTTAGAA ATGAAAGCAA 
GATTCCTAAT ACCCATTTAA 
TATTTTAGCA TCTAAATTAG 
AGTATTAAGT: ..TCX3CTTT.TAA 
AATCTTAGTA TCTAAATTAG 
AGTATCTAAA yTAgaTmTAT 
AAGTTCACTT TTAACAGCAT 
AGAAACAAGA TTATCAAATT 
TGTTAGTTCA TTGTGATAAT 
CAGTCTAATA AATTCTTTAT 
TGTTTCCATA AAATTTTCCC 
AGA6ATTTTT ATATGTAAAG 
TTTAACTTCA GATATCAGTT 
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ATTTCAATAA 
ATCGGGATGT 
AATTTAATTA 
GGTATAATAA 
TGTAAGACCA 
TTCTTCATTA 
TAAGTTGTCC 
TACAATCAAT 
AGAAGTTGTA 
AAAGCCAATC 
CATTGTTTAA 
CTTCGTCGGA 
GTTTTTTCCT 
TACAGCTATT 
CTCCTTTTTT 
AATTATTATT 
ATATTAGCCC 
GCATTTCTGT 
ATATGTCTTT 
CAGTATTAAT 
ATATATCyTT 
cTTTTwGtaA 
CAATCTTAAC 
TTATATCAAA 
ATCTTTTAGA 
ATATTTGTTC 
TTATGGTCAT 
TAGAATTTCT 
TTAAATTTTT 
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AACTAATAGA 
TTATAAAACA 
TATATTTGCA 
TTAAGGTTTT 
GCATAATGAT 
GAATTTCTAT 
ACCTCCCCAT 
AGCTCCTTTA 
AACCTTGGTA 
AAAGAAGTCA 
TTTTTCAATT 
TGTTAAAGTG 
GCTTTTTGTT 
TAGTAGTAGC 
TATTATTAAT 
TGAATTGATA 
GGCTATCATT 
AAGAGACATT 
TTGTAAATTC 
CTTAACATTT 
TTGTAAATTC 
ATTCTTTTCy 
ATTTAAATTC 
TTGTTTTTCT 
TAAATCTTGT 
TTGAGTTACA 
ATTATATACT 
TGCAAGAAAA 
TACTGTAGAT 



TTTGATGATC 
AAAGTATTAA 
GCATAGCAAT 
TATTTTTGAT 
TATCTTCTTT 
TAGaCATATC 
ATTTCATTAT 
ATATAAGTAT 
AAAGCACCAG 
TTACATTTAC 
GTGTATTTAA 
ATTTTTTCTT 
TGTTGGGCAT 
AAAGATATAC 
ATTCACTTAA 
TGTTTTAAGT 
GTGATAGACA 
AAATTCTTTT 
TTTTCTACAT 
AAATTCTTCT 
TTTTCTACAk 
ACATTrTCTA 
TTTTCTACAG 
AAATTTTCTA 
GCTATTAATT 
CTTGCAATAT 
ATTTTAGATT 
ACCTTTTTGT 
TTTTTACAAA 



TAAATAAGCT 
AATTCTTTTG 
ATTAAAGCCC 
TGAGAAATGT 
TAAAAgTTCA 
ATTAGCGACG 
TTTTATTACA 
CAAAAGTTTC 
CTAATTCTTT 
TTTTGTTTCC 
ACACATTGAT 
GTTGTGGCAG 
TGTTTTTTAA 
AAAATAATAT 
TCAATTATTA 
GAGGTAGTAG 
TTGCTCCCAT 
CTACATTATC 
TGTCTATTTT 
CTACAkTATC 
TATCwATCTT 
TCTTGGTATT 
TATCTATTTT 
AATCTCTATA 
GTTCCATGCC 
TTGTTGACAC 
AATTGGCTTT 
AATTTACATT 
AACAGTATTG 



420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
.15-60 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
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CAAAAACTCT TAGATTACTT^WTCTTTTCT TTGTATACTA CAATAACTCCtJaAACCCACT 2160 

AAATGGTTTA GTGATTTAAC CTCAAGAATA TTTTCGGCAC CTATTTGGTT AATAAAATTT 2220 

TCTAACCCTA TCCCTATAAT TTCGAATAGA GTTTTGTTTT TATCTTCTTT TTTTATAGGA 2280 

AAGTTAATGk TATGCTTATG ATCATCACCG CCTTGATCTA AAGCaTTAAA GTTTTAACTT 2340 

TaTAATTTCA TCyTTTTaAT TcATATGAAA TTAAATTACC AATACTGATA ATAAACATAA 2400 

aTAACATTAA TAAATTAATT TTTTGcACAT tGTGTTCCTT AATAAATAGA ATATTAACAA 2460 

TATTATATCT TTATTAAGAT TTGCCCTAAA ATATAAAATT TTATTAAAAT ATAGCAGTAA 2520 

TAAACGACTT TAAGAATATA 7UVTGGGAATT TCTTGCAAGA AAAACCTTTT TGTAATTTAC 2580 

ATTTTTAATT GAGAATATTT ATTATAGACT TTTTCCGCTA TTGGTTTTGT TTTTTTAATG 2640 

TACTCTAAAT ATATGTTGAG GGTACTCTGA GCTCAGATTT TT 2682 
(2) INFORMATION FOR SEQ ID NO: 48: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2532 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48: 

CGGCATnACC AGTAAAGTTC AACACTAGAA TATTGCCTTA AATGCACGTA TAAATCCTAA 60 

TTTTAAATTA GCACACTCTA TATCTAATTC ACTTATAACT TTCCtAGCGT TAACTTCTGA 120 

TTTAAAAGTT TGTGATAAAA GGTGTTCTAA AGTATCTTCA CTAATTGTTA CTCTAGAGTC 180 

TTGGTTAACA ACACTTTCTC CACTTTCCCA TTTTTTCCTC ATCCTGCACA CATTTACCCT 240 
AGAAACCCCC AATTC'ATCCG CTATTTCCCT ATCATCTAAC AATCCTTCTC TAAAATATGC " 300 

AACATAATCA TCAAAAGACC TTTTGGCTCT TTTCAAGAAA ATTCTCCTAA AATAACAAAA 360 

TTAACAAATT GTTACTCTAA ATAGTAAAGC AATTTGTTAA TTCAATTAAC ATAAATTATT 420 

AATTTCTTTA TACCTATTAA CAACTGCCCT ATATTTACAA TATTTATTAA TATAAAAACC 480 

AAACATTTCA AATATCCAAA AAGGAGCATT TATATGAATC AAAAACAAAT ATTTTTATTA 540 

TTTTTATTAT TTTTAAAAGT AACAATAAGT TTTTCTTATG ATCAATCTCA ATACAAGGGA 600 

TATATGGAAA AATATTATCA TAAGAAAGGC AAAACAGATA CGCACATATC CTTTTTTCAA 660 

ACTCTTAGTG CTGATGAAGG GGGTTTTTCT ACTATCTTTA TAGGAGAAGA TGAACAATTA 720 

AGTCGTCTTA GTTTTACCAC TTTAAAGGAT ATTAAAGACG GCAAAGAAAC CTCTTATATG 780 

GGTTTTAACT TAGAATACCA TTACAAAGCA AAGTTTAACA ATCCATACCC TATGTTAAAT 840 
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GATATACGTG CAAACATTAG TAAAGTGAAA GTTAAATTTT TTTTTGATAA TGGCCCCGAA 900 

AAAATAATAA GAGAATTAAA TCAAAAATTT GTAAATAATA GAGTTATGTG GGAAATTTGG 960 

AATAATTCAT ATAATAAGCT TTCAGAATAT ATTAGGATTA ATCTAAGAAC CTCTGATCCG 1020 

GGCATAGAAA ATTTACTGCC AAAATTATTA AAACATAAAA CCGTAACAAT AACAATTGAA 1080 

ATTCCTGAAA GTGAAGATCC TGAGAAATTA ACTAGTTGTA TAACTTTTGA TCTTGATAGC 1140 

TTTCAAAAAC TATACAAGAA ATATAGTACG TATTTTAAAT AATATAACAA GACTCGCTGT 1200 

GAGTCTTGTT ATATTATAAT TTATGATTGT AAAAAAAATT TTTCTATTCT TTTTTATTAG 1260 

AATCTTTAGA TTCTTTCTCT AACTTTTTAA GCTCTTCAAG CTCTTCTTCA ATCTTTTTAA 1320 

GCGAGCTTAC TATTATTTCT TTAGCTATAT CGCTAGTACT ATTACCACTA GAAATATTTT 1380 

TAAAGCCCAA ACCCCGAGCA TGCCGCAAGG nTTCTATTCC AACTTTCCCT TGATTTTTAG 1440 

CCCTTTCTCC ATCAGTTATT CCAATTGCAG ATTCAACTTG ACCCTTAAGT TCTTCAAATT 1500 

TTTTTTGAGA CTCTTCTAAT TCTTTTTTTC TTTTCTCTAT TTTTTCATTT AAAGCTTTCT 1560 

CAAGGATTTC TAATTCTTTT TCAAACTTTT CTTTATCTTT TAGTTTTTCC TTTAATTCTT 1620 

CTATTTCCTT TTCATAATCA GAATATGTTT TAAGAGAAAC ACTTTTAGGA TCCGACTTCT 1680 

CTATCTTATC CTTTAATTCT TTTATTTTTT GTTCAATTTC TTCTTTTAAT TTTTGATCTT 1740 

CAGCAACACC TTGAACCACT TGATCTTCGC CCTGCTCCTG AGGCTCATCA GCTTGCATAG 1800 

ATTCTTCATC CTTTGGTTGA ACTTTTGCTT CTGGTTTTTT AAAATCTCCA AAAAACTCTT 1860 

CTTTTTTTGT ATCTT^AAAAT CCCTTAACTT TTCCTTTTAA ATCTTGTTCT AAACTTTTTT 1920 

TTACATCTTC ACCACTTGCG TAATTCTTGC AAGAAACTAT CAGCGCAAAA ATAGCACAAA 1980 

TAATJ^A^^-CAT TTTCTTATTC- .ATAAGTTGGT CCATAAGTCT TAAATGTAAG GCAACACCQA- - 2040 - 

ATAATTACAA TTTTTCAAAG ATTTAAATAT ATAATTTTGT TACATTCAGC TATTACATAT 2100 

TAACAAAACG CAAATATAAT TTTAACCAAC TCCCCAAAAT CTCTCCATTG CAAATGCACC 2160 

ACTCATTACA AAAGACTACA AAATCCATAC AACTTAAATT TCAAAGTCTT TGCTATATAT 2220 

TAGATAAAGT ATACTGTCTT TCTTATCCGA CACCCTCAAA AAATGCCTAT TCTGTTTATC 2280 

ACAGCCACTC CACAACCCAA ATTTCGCATG CAATGAGAAC ACCCAAAATT TGACTAAAAT 2340 

TTTAGGTTTT TGATAAAATA TAAATTACAT TTTTATTAAA TTTTTATTAG TTTTACTTAA 2400 

TTTAAAAGTA ACACTTCTAA GGAGAGGATT TTATAGATAT GAATAATTAT TTTAATTTAA 2460 

ATAATTTCAA TATGGATTTT ATGCTCAAAC TATTTCAAGA TTATCAAAAT GTGGTAAATG 252^ 

AAAATAAAAT TO 2532 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2528 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49: 

nAGGATCCCC AGCTCCCtTA ATAGCCCCCa TCAGCCTTCC CTTTCTCACC ACCATCCTTC 60 

ACAGCAAACT TTCCATCCTT AGCCATCCCC CTCAAAGCAA TAGCAGCAGC AATCTGATCA 120 

TCCTTCTTCA TCTCATCCTT AAACTCCGCA CCATTCTCCT CATTACCCTT CCCAATAGCA 180 

GCAGCAATCG GATTTGTAGC ATCCCCAGGC TTCTTTCCCT CCTGATCAGC CGCATCAGCA 240 

GCCTTAACAA TCGCACTTAA TATCTGCTCC CCACTAACAG CACTAACAGC ACCAGCCGCC 300 

TTGCTAGCAG CCTCACTGTC CCCAGCATTA GCACCAGCAC CAGCCTTCCC AAACAACTTC 360 

CCTGCCCCTT TATTACTCTC CCCTGTAGCA GCAGCAACTT TCAGCTTTTC ACTCCCCCCA 420 

GCAGCTTCAA CAATCTCCTT TATCCCCTTA GCAATCCCCG TCACACTCGC CTTATCAGCA 480 

ACCTTTGCAG CACCAGCATT AGCCACAACT TCTCCAATTG CATCAGTACC ACTTGAAGCC 540 

CCCTCAGCTG TCTTTACAGC TTTTACCAGC TTATCCAACA ACTCAGCAGC TCCCTTAATA 600 

GCGCCCTCAG CCTTCCCTTT CTCACCACCA cTCtTCACAG CAAACTTTCC ATCCTTAGCC 660 

ATCCCCCTCA AAGCAATAGC AGCAGCAATC TGATCATCCT TCTTCATCcn TCATsmTTAA 720 

ACTCCGCACC ATTCTCCkCA TyACCCTTCC CAATAGCAGC AGCAATCGGA TTTkTAGCAT 780 

CCCCAGGCTT CTTTCCCTCC TGATCAGCCG CAtCAGCAGC CTTAACAATC GCACTTAATA 840 

TCTGCTCCCC ACTAACAGCA CTAACAGCAC CAGCCGCCTT GCTAGCAGCC TCACTGTCCC 900 

CAGCATTAGC ACCAGCACCA GCCTTCCCAA ACAACTTCCC TGCCCCTTTA TTACTCTCCC 960 

CTGTAGCAGC AGCAACTTTC AGCTTTTCAC TCCCCCCAGC AGCTTCAACA ATCTCCTTTA 1020 

TCCCCTTAGC AATCCCCGTC ACACTCGCCT TATCAGCAAC CTTTGCAGCA CCAGCATTAG 1080 

CCACAACTTC TCCAATTGCA TCAGTACCAC TTGAAGCCCC CTCAGCTGTC TTTACAGCTT 1140 

-TTACCAGCTT ATCCAACAAC TCAGCAGCTC CCTTAATAGC CCCCTCAGCC TTCCCTTTCT 1200 

CACCACCACC ACTCTTCACA GCAAACTTTC CATCCTTAGC CATCCCCCTC AAAGCAATAG ..'iSeO 

CAGCAGCAAT CTGATCATCC TTCTTCATCC. . C ATCATGATT AAACTCCGCA CCATTCTCCG V 3.3 20 

CATCACCCTT CCCAATAGCA GCAGCAATCG GATTTTTAGC ATCCCCAGGC TTCTTTCCCT 1380 

CCTGATCACC AGCAGCCGCA CCAGCAGCCT TAACAATCGC ACTTAATATC TGCTCCCCAC 1440 
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TAACAGCACT AACAGCACCA GCCGCCTTGC TAGCAGCCTC 
CATCAACTTT CCCAAACAAC TTCCCTGCCT TTTCATTGCC 
TCAGCTTTTT ACTCCCCCCA GCAGCTTCAA CAATCTCCTT 
TCACACTCGC CTTATCAGCA ACCTTCGCAG CATTATCATC 
CAGCAGTACC ACTTGAAGCC CCCTCAGCTG TCTTTACAGC 
ACTCGCCAGC TCCCTTAATA GCCCCCTCAG CCTTCCCTTT 
ACTTTCCATC CTTAGCCATC CCCCTCAAAG CAATAGCAGC 
TCATCTCATC CTTAAACTCC GCACCATCCT CATTACCCTT 
GATTTTTAGC CTCCCCAGGC TTCTCTCCAT CCTGGGCAGC 
TCGCACTTAA TATCTGCTCC CCACTAACAG CACTAACAGC 
CCTCACTGTC CCCAGCATTA CCAGCACCAG CCTTCCCAAA 
TATTCTCCCC TTCAGCAGCA GCAACTTTCA GCTTTTCACT 
TCTCCTTTAT TCCCTTAGCA ATCCCCGTCA CACTCGCCTT 
AATTAATAAA AACAAAGAAA GTTGTTAATA AAATTGCACT 
TTTGTTTAAT GATTGTTTTG AACATTTAAA AAATGTTTTT 
TGTTTAAGTT AAAGTTAAAT AATAATAACT AGTTTTTTTA 
CTACTTCCGT ATCACATATA ATAAAGTTTG ATGACATATA 
AGTTTTAACA AGTGTAGGTG AGAGAATTTT TCATTTCTTT 
ATGAAAAA 

{ 2 ) - INFORMATION FOR ^SEQ - CD • ^JO : • S O-; - - 

(i) SEQUENCE CHARACTERISTICS": 

(A) LENGTH: 2496 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ACTGTCCCCA 
CTCTTTAGCA 
TATCCCCTTA 
AGCCACAACT 
TTTTACCAGC 
CTCATCATTC 
AGCAATCTGA 
CCCAATAGCA 
CTCACCAGCA 
ACCAGCCGCC 
CAACTTCCCT 
CCCCCCAGCA 
ATCAGCAACT 
TGAAATTTTT 
GTTAAGAGGC 
ATTGGATTTG 
TAGTATTTTT 
TATTATAAAG 



GCATGAGCAG 
GCAGCAACTT 
GCAATCCCCT 
TCTCCAATTG 
TTATCCAACA 
TTCACAGCAA 
TCATCCTTCT 
GCAGCAATCG 
GCCTTAACAA 
TTGCTAGCAG 
GCCTTTTCAT 
GCTTCAACAA 
TGGCTTTTAC 
TTCATATTTT 
TTTTATTCTT 
TGAATTTTGC 
ATTGCTTGAG 
AATAAAAGAA 



1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
"2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2528 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50: 

TGCAGGTCGA CTCTAGAGGA TCCCTGCCTC TTyaAGTATG CTAGCCAAAA TATraCGAGT 60 

AAwTTCTTTG TCTGATACTT TAAATTCTTT GTCATATATA TTTTTTkcAA TTTTAAATAC 120 

TATAGT^TCA TCAGGcTcTC ATAAAGyATC TCTCTAAGAG TTTTTTGAAT TATlrtTCTTTT IBCT 

TCtTTrgAtA TTTGyTCTTT TTCAACTGmT ATTAyATTrC TTGTyTTTAG GTATCTTTCT 240 
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TTTCTTATAA GATAGCTAAA TAAAATAAAC CATTCTTGCT CTTTATATTC TTCTTTtTCT 300 

TTAATTTTAG AAAAATCAAA TTCAATATAT CTTTTTTCTC CATAAAGTAC TTTCGATTTA 360 

TCATATAATC TCCATACCTT TCCATTTGAA AGTATCCCAT AATGTTTTTG ATATTGATTT 420 

AGATATCTGT ATAGCTGATC TTCTGCTTCT TTTACCTTAT CTTTAGCATC AAAACTAAAT 480 

GATGGACGCT TAACTTCTGC TATAAGCAAG ATATCTTCAG TTGGAATAGA TTCATTATTT 540 

TTTTTAGCTT CTTCTAATTT TTTATTAAAA GCTACTTTAT CTTTATCATT TTCAAAAAGT 600 

AGTATATCTA CTCTGGATTT TACTCCTTCT ATTTGCCCAC CTTTTTGTTG TTCTACTGAA 660 

TAAGCTAATT CTTCAAATAT AGACTTTAGC AAAGACTCTA TATTTGCTTC TGTTGAATTG 720 

TCATCTATAG CTTGAATTTT ATTTTTTAAA AAAATAAAAA AGTTTTTTGA TTTAACAATA 780 

TTTTCTTTTT TTATAAAGGC TTTTGACAGT TCTTTATAAA GAGATACATT TGGATCATTT 840 

GTTTTTATAA TGAATCGGCT TTCATTGTTC ATATTTACAA CCATTATGTT ATTTATAAAT 900 

CCTTTTTAGC CCTTCTTGAT ACTCGAAATG TACTCTAAGA TTAGTTTTTT TAAAATTAAA 960 

AAAACTAATC TTAGAGTAAG TCGGCCAAAA CTTGTTTTAA TATTTATTTG ACTATCAATA 1020 

CTCTATCTTT AGAATAAGCT TGTTAAAAAT TATTTCTCAC TTTTTCTCAA TTAATTAAAG 1080 

TTATTAATTT ATTTTTTATA AGGCATCCTT AATTAAAGAG CATTTAAAAA ACACTTTTTT 1140 

AAAACCGAAT TTTTCTTAAA CATTCCCCAA TTTGTGAAGC ATAAACAAAA AAATGTTTTT 1200 

ATCCTTTTCA TTTTCAAAAT TACAATTATA GAGTCTTTTG TTAATTTCTT CTTTAAAAAC 1260 

ATCTTGCTCA GAATCATGCA AGCAACAAAG ATGCAAAAAA TTTTTAAAAG AACTTATCAG 1320 

GTCAAAAACA ACACAAATAA TAACCCAGTT TTTATTCATA ATTATCCTCT CTCAAAATTA 1380 

AAAAATAAAT CAAAGTCTTT GATTTACAAT TTTTTATTAA GCAGTGAAGG GGGAAAAACA 1440 

AATTGTCCTA AATATTTAAC AAAAAATGGA AATAGACTTA ATAAACTTGG TTTTTTCTCA 1500 

GGAAGGATTT CTAATTACAA CATCAAATTC TTCCTGAATA TCTGGAAACT CAATTCCATA 1560 

GTAAAAAAAT TTATAGTAGC CGCTTAATTT TCTAATTATA TCTATTTTTT CTTTATCTTT 1620 

ACTAGAAGTT TTATTGCCTA AAATATTTTC AATTAAACTA ATTAAAGCTG TAATATCACT 1680 

AAATTTTATA TTTAAAGATT TGTCAAAAGA TAATGAATAA AGTTTAATTA AAGAAAATAT 1740 

TATTCCTAAA TTATCTGTAT CTTCACTTTT CTCATATTCT TTATATATAT TTTTAGATCT 1800 

TTCTATATCT TCTTTAGCAG TATCGTTAAT ACCTCTAATT TTl^TbATAGC TATATTCTAA 1860 

AATAATTGTA ATTTCTTTAA TTCTCTTTTT AAATAAAGAA AA4?GCACCTT CAAATTTCTT 1920 

TTTTTTAATA TCAAAAAATT AATCTTTGGC ATATCCTAGT AAAGGATTTC CTACTTTTAT 1980 

ATGATGTTCA ACAAAGCTTA ATGGTGTTCC AAAAATAAAA TATTTTAATA ATCTAACTTA 2040 
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TTTTTTTGAG ATAGTTTTTT ATAAAACTTG CCCAAGCAAT CTATACTCTT AAGTTCGGGT . 2100 

TTTCTCAATC ACCTATAACT TTATTTGCTA ATTAATTTTT TATAAAAGCT ATCCTTAAAT 2160 
TTTTCAAAAT ATACTATATG AACTACTGCT TAAAAAGCAA AGACTATAAA ATAAGTAGTT . 2220 

CATCAGAAAG TTTTTGATGG TATTACTACT ATTAATAGAA. TTTAAAAAAT CGAGCTTACC 228D 

AATGTATTTA AATAAACTAG AAAGCAAACC AC7VATACATG ATTAAAATGA. TATGGGCAAT 2340 

AAACTTAAAA AGTTTAACGA TAATTTTGAA ATTCTTATTA GAATCTAATT AAAAATGTAA 2400 

ATTTATATAA ATTTTATAAA TAAAGAGTCA AAGAAAACGC TTTATACTAG AAAGTCTTTA 2460 

TAAAGATAAT AAAATATATT TTTTAGAACT TTCTTC 2496 
(2) INFORMATION FOR SEQ ID NO: 51: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2487 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51: 

ATTTATTTAC ACGAAACCCT GACTTTTTGA GAAGATTTTT GAATTTATTA GAAATATGGA 60 

TAATGCTAAT TTGGTTGTCT TTAAACTTAT GTTTGGATTT TTGAAAAAAA TAAGTACGTC 120 

TTGTATCAAG ATTTTTCTCA TTAAAATGAT TTTTGTGTGC TGTTTGGATA GCCTCGAACT 180 

CTTCTGAGTT GATAACAATT TCTCTAATAC AAGTTACATT TCTTTTTTTT GCCACATTTA 240 

CTTTTATGTT GTATAAAGTT TTTCCATTTT TGCTTAAAAA AGTTGAAATA TCTTGCATTT 300 
-TTAC-TTTTTGrCAGTTCGGTG-eCCCTGCAGC CACTTATTGC GAGTAAATGT AAAAACCAAG- - -- 3 60 

CAGATATTGG ATCAGCTTGT TTAAGAGTTT TGATGCATTT TTCAATTAGT TTGCCAATTT 420 

TTGGGGTCAA ATAAAATTTA GGAGTTGGCT TTGAAGCTTT TTTAGTAGGC TTAGAAGAAA 480 

TTTTTAGTGA ATTTTTAAGA ATTTTGTTTT CATTTATTAG TTTTTGATGA TCTTGTAATA 540 

ATTTAAGCAT AAAATCTATG TTGAAATTAT TTAAATTAAG ATAATTATTC ATGTCCATAA 600 

AATCCCCTCC TTATAAGTGT TACTTTTAAA TTAAGTAAAA GTAATAAAAA TTGATTAAAA 660 

ATGTAATTTA TATTTTACCA AAAACAAAAA AATTTAGTCA AATTGTGTGG CTTCTCATTG 720 

CATGCAAAAT TTGGATTGTA GGATAGCTGT GATAAACAGA AGAGGCAATT TTTAAGGGGT 7 80 

GCACTTAAGA AAGATACTAT ACTTTAAGTG ATATATAGCA AAGACTTTGA AATTTAAGTT 840" 

GTATGTGTTT TGTAGTCTTT TATAATGAGC AGGCCATTTG CAATGGAGAG ATTTTAGGGA 900 
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GTTGATTAAA ATTATATTTG CGTTTTGTTA ATATGTAATA GCTGAATGTA ACAAAATTAT 960 

ATATTTAAAT CTTTGAAAAA TTGTAATTGT TTGGGGTTGT GGTAAACTTA AGGCTTATGG 1020 

AGTGGATTAT GAATAAAAAA ATGAAAATAT TTATTATTTG TGCTGTATTT GTGCTGATAA 1080 

GTTCTTGCAA GATTGATGCA ACTGGTAAAG ATGCAACTGG TAAAGATGCA ACTGGTAAAG 1140 

ATGCAACTGG TAAAGATGCA ACTGGTAAAA ATGCAGAACA AAATATAAAA GGGAAAGTTC 1200 

AAGGATTTTT AGAAAAGATT TTAGATCCAG TAAAGGATAA AATTGCTTCA AATGGTCCAA 1260 

TAGCAGATGA ATTGGCAAAA AAATTACAAG AAGAAGAAAA GGTAAATAAC GGGGAAGAAG 1320 

AAAATGATAA AGCTGTCTTT TTAGGAGAAG AATCAAAAGA GGATGAAGAA GAAAATGAGC 1380 

AAGCTGTTAA TTTAGAAGAA AAAAATGCGG AAGAGGATAA GAAAGTTGTT AATTTAGAAG 1440 

AGAAAGAATT AGAAGTTAAA AAAGAGACTG AAGAAGATGA AGATAAAGAA GAAATAGAGA 1500 

AACAAAAACA AGAAGTGGAA AAAGCACAAG AAAGAAAACA ACGACAAGAA GAAAAGAAAC 1560 

GAAAAAAACA AGAACAGCAA GAAGAAAAGA AACGAAAACG ACAAGAACAA AGAAAAGAAA 1620 

GGAGAGCTAA AAACAAAATT AAAAAACTTG CGGATAAAAT AGATGAGATA AGTTGGAATA 1680 

TTGATGGTAT AGAAAGTCAA ACAAGTGTAA AACCGAAAGC AGTTATAGAT AAAATTACGG 1740 

GGCCTGTATA TGATTATTTT ACCGATGACA ACAAAAAAGC TATATATAAA ACATGGGGAG 1800 

ATTTAGAAGA TGAAGAAGGC GAAGGATTGG GAAAATTATT GAAAGAATTG AGTGATACTA 1860 

GAGATGAGTT AAGAACCAAA TTAAATAAAG ATAATAAAAA ATATTATGCC CATGAAAATG ^ 1920 

AGCCTCCTCT AAAAGAAAAT GTAGATGTCA GCGAAATTAA AGAAGATTTA GAAAAAGTAA 1980 

AATCAGGATT AGAAAAGGTT AAAGAATATC TTAAAGACAA TTCTAAATTT GAAGAAATTA ' 2040 

AAGGATACAT CAGTTACAGT CAGTAATTAT ATTGGATGCT TTTAGATGTA ACTAAATTTT 2100 

ACGTACACAA AATAACAGCT AGTAGAAAAG TTCACTGGCT GTTATTTTTT TGTAGATTTC 2160 

ATTGTTATGA ATATAGAAAT GTTTTCTATC AAAACTTTCA TTTAAAAAGT GCAAAAACTA 2220 

TTGCTAAAAA TGTTGTTTAT TTATATACTC TCTAGAGCTA TGACGTATAC A/^TGAGATT 2280 

TCAGATTTTG ATGATAATTT ATATAAGAAA ACAAAAAAAG AAATAGATAA ACTTATAAAC 2340 

AAGCTCTATT TAACTAGCCn AATAACTCTA AAGCAAAAAA GACAAATnTA CAGTGCTGTT 2400 

GAAAGAATGC AAAAATACGT AATAAAAACC GGAAAAAGTG TTCTTTTAGA ATCGGAAAAA 2460 

GAATTTGTTA AAGAC ACTTT GAAAAGA 2487 

<2) INFORMATION FOR SEQ^'lD NO: 52: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2462 base pairs 

(B) TYPE: nucleic acid * 
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SDNESS 



(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52: 

AGGAGATAAG TTTATTGGTA TTTTTTATGG CTATAGAAAC CCAATCAAAA cCTTTAATAA 60 

AGTATaAAAT AAATGGAACT AGAAAaGCAT ATGCATTAGC AAGAGCaTAT TATATGGAAT 120 

TTAGATTTAA AGCCgGAAGT GTTTTTTGCT ATTTTAAGGG GCTATATCGT TTATTGGATA 180 

AAAAAAGAAC AAtAATCaTT ACAACAAAGT TTTATTTAGT ATGTTTGCaG ATTTAGaACA 240 

ACAAGTATAT AAATTTTATG GGAAAAmATA CCCGGAGCaA GGACCGTTAA TAAAATGGAT 300 

AATAAAAAAC CTAAAATAAT AACAATAGCG TCAATCAAGG GCGGTGTTGG TAAAAGCACA 360 

AGTGCCTTAT TTTATGGCAA TATTTTAGCT, AAAGAAAGAC ATAAAGTATT GATAATTGAT 420 

AGTGATCCAC AGGCCAGTAT TACTAGTTAC TTTTTGTTTA AATTAAAAGA ACAAAATGTG 480 

AATGTCGAAA ATTACAATCT TTATGAAGTT TTTAAACAAA GAAAATATAT AGAAAATTGC 540 

ATTTTTACAG TATCTAATTG TTTAGATATA ATTCCCAGTT CCTTAGAATT ATCTGTTTTT 600 

AATTCAGAAA GCATACCATT ACAAGACAAC CTTTTAGAAA AAAGACTTTT GACTATTAAA 660 

TCTAAATATG ATTATGTGAT AATCGATACA AATCCCAGCT TAGGACATCT TTtAAACAAT 720 

GCTTTAGTAA TTACCAATTA TTTAATAATA CCAATTAATT CCGATTTATG GGCAGTTGAA 780 

AGTATAGATC TAATATTAGA TGCAATAAAT AAAGTTTATA GAAATGATAT TACACCTTAT 840 

TTTTTAGTGA CGGGGGCACT AGAGAGACAA AACATAGATA AGGAAATAAT ATTTAATTTG 900 

GAGAATAGAT ATAAAGAAAA TCTAATAGGA GTTATTCCTA AAAGAGATGA TATCAAAAAA 960 

GTGCTGTTTT ATAGAAAAGA ATTTTCTTCA -AAAAGAGACT ATTATCAAGA A-TATAAAAAA 1020 ' 

TCTTTAGATA AAATGTTAAA AATAAAATAA CAAATAAAAT ATATCCAGTA ATGGACAAAT 1080 

AAGGAGTTTG CATGAGCATT AAAAATAAAA TGATAATAAC CAAAAGAATA GATATAAAGG 1140 

AAAATATGTC TAAAATGGAG TCATTAGAAG AAATTCATAA AGAAGAATAT TTGAGATTAA 1200 

AAGACAAATT AAAAACTCTA ACAACGGATG ATATTTATAA TA/IAATAGAA ACAGCAAAAA 1260 

TATTAAATGC GATTAATCAA AAAAAACTGT ATATTTTAGA CGGATATAAA AATTTTTATA 1320 

GCTTTTTAGC TGATTTTAAA ATCGCTAAAT CTCAAGCATA TAAATATATA AAAATAGTAT 1380 

CGGGCGTAGA AAAAGGTATT ATTGACTATA ATTTTATTGC TAATAATGGC ATTGAAAAAA 1440 

CAATTAAACA ATTGGAAAGT AACAATGTTA TTAAAAAATC TAGGCAAAAT CCAATAAAGC 150a 

CTTTAAGGTT TCAACTTAAA AAGCAAGAAA GTTATGATTT TTATAAAAAA AATGGGAAGT 1560 



wo 98/58943 

1031 

TTACTGGGTT TTTATTGGAA GAACTTCTTG AAAGTCAAAC 
TAAAAAAATA TAAACAATTA AAAGGATATT AAGAGGATTT 
GAACATATGA TATAGAAAGC ATAAAAAATG AATTTTTAAA 
CAATAGATTT TGTTTTTCTT CATAATGATA ATTACAACTA 
TAATTGATGT AGAAAAGAAT TTGCAAAAAG ACATATCTAG 
ATGTAGAAAA GAATTTAAAT GTTAAGATAG ATAATGTAGA 
TA<3ATAGTGT TAAAAATGAA CTTAATTCTA AAATAGATAG 
ATGTAGAAAA AACTTTGCAA AAAGATATAT CTAGCTTGAA 
AAAAAACCTT ACAAAAGGAT ATATTTAGCC TAGATAATAA 
AACTTACTGC AAGTAATAGA ACAATACAAG TAATTTTAAT 
CAATTATTTA TTCTATATTC AATAAGCaTT TTTTAAATTA 
AaGTAATAAG TTAGTATATA GCTTtAAAGT AGAACTTATT 
TTTAAATAGG TTCTTTTATT TTAACAAATA CAAAATAATT 
ATTTAATTGT TTAGTGAGTT TATCTAAAAT AAATTGAGCT 
CTCTTTAACA TGAGAATTTA ATAAAGCTTT TATTTATTAT 
TG 

(2) INFORMATION FOR SEQ ID NO: 53: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2447 base pairs 

(B) TYPE: nucleic acid - 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



PCT/US98/12764 

AGATTTGATT AATAAGCTTT 162 0 

TATGAGAAAT TTGGTGCACA 1680 

CATAGGATTT AGTGAAGAGG 1740 

TGAGGTTTTA AAAGAGAAAA 1800 

TTTAGATACT AAGATAGATA 1860 

GT^GAATTTA AATATTAAAA 1920 

TTTAGATACT AAGATAGATA . 1980 

TACTAAAATA GATAGTGTAG 2040 

AATAAATGTT TTAAAAAACG 2100 

AATGGGAATA ACGCTkGCTC 2160 

AGAaTGATTA rAaTTTTATA 2220 

TGAATTTTTT AACAAGAGAA 2280 

TTAATTCTAA ATTGAACTGA 2340 

AAGCCAGCGG CTTTCTTAAG 2400 

AATAATTTCT GTAAAAAGCn 2460 

2462 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53: 

AACCCCnAAA AAGGGCTCCC AATATTAAtw GAGAGATTTA TATTTTTCrA ATGTTGTGCT 60 

AGCTTTTATy TCATTATTAT TGAATATAGG AGTAACTAAT GAGAAATAAA AACATATTTA 120 

AATTATTTTT TGCAkCAATG TTATTTGTAA TGGCTTGTAA AGCATATGTA GAAGAAAAGA 180 

AAGAAATAGA TTCATTAATG GAGGATGTTT TAGCTCTTGT AAATGATTCT TCTGGAGGCA 240 

AATT'TAAAGA TTATAAAGAC AAAATAAATG AATTAAAAGA AAATTTAAAA GATATAGGCA 300 

ATTGCrGAGCT TAAAGAAAAA CTATTAAATT TGCAAAATTC CTTTCAGGAT AAATTAGCGG 360 

CCAAATTAGC AGCGTTAAAA GCAGCTAAAA ATACCATTGA AAACATTACT GACAAGGATC 420 

AGGATATTTC AAAAAGAAAA ATATGGTCAG AAGCAAAATT AGTTGGAGTA ACTGTACCAC 480 
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TTCTTGGAAG CAATACTTCT GGTAATGGGG ATAAAATGTC TAAAAACGCT GTAGAACAGA 540 

TAGACAAAGT AATAAAGTTC. CTCGAAGAnG GCACTAATTA ATTAGCAAAT ATTCCTGTTG 600 

AAAATGTTAA AATCTAGATA TTAAATCTGC GTCAATCTAA TATCTAGATT TTTCTTTTGT 660 

TGCAAAAGCC GATTTGATCA TAAATTAGAA TTTCTTGCAA GAAAAACCTT TTTGTAATTT 720 

ACATTTTTAA CTTCGAATAT TGATGATATA CTTTTTCCGC TATTGGTTTT GCTTTTTTAA 780 

TGTACTCTAA ATATATCTTG ATGTTATGTT TTACCGCAGt ATAGAGTGTT CGTCTTTTAG 840 

TGTTGATAAG TCTGGATAAG GATATTCTGG ATAATTGGGG TCATTAACTT TCACTTTTGT 900 

TTTAGCTAAA AATGTTACAA GATACATAAC . ATATTCTGAA AGTTGTGTTT CATATTTAGC 960 

TAAAGATTTT AGCGTTGGAA TAATTGGCGG TTTTGGTTCT TCTGGTAGGT TAGCAATAGT 1020 

GGTGCAACAT AACAACAAAA CAATTAGTAA ACAATGCAAT CTTTTAAGCA " TTTTCACTCC 1080 

TTTTAAGCAT TTTGATGTAT TCTTTCATAA TTTTGTTGCG TTTTGCTTTA AGTGAAGTGA 1140 

TAATTTTTTT ATTTTTGTCA TAAGAGATAG CCTCTATTAT CTCAATATTG TATTTTAAAA 1200 

TGTCTTTTAT TTCTTCAAAT ATTTTAGTTG AyTCAGCTGT TTCCATAGAT TTTAGTGTGC 1260 

TTATATATGT TTTATAGAAA AAATCTATTA CTTTACTAAA AQTATTAATG TAATTATGAT 1320 

CTATGTTTGT ATCAGTTTTA GCTATGTTAG TTAAGCTAGA TAGTAAATTA AGTCCCAATT 1380 

CAATAGTGTT CTTTTGCATT ATTTGCTCTC TCTTTGTAGA TAGGTTTTCC GTCTTTATTG 1440 

AATTTTAGAT CATTGGATAT TTTTAGATTT TTATCATTAG AATTAACCAA ATCAATAACC 1500 

GTATTGATTT TTGCATTTAA AGGAGCGAGT GCCGCATTTA TTGCTGGGGT TAATGCACTC 1560 

TCAAGTCTTT CCATATTTGC TGTATAGATT AATTTATAAT GAGAATACAG CTCATAAACC 1620 

AAAAAGA^TIC. .CTTJATXiyGC AMTTCATCA^AATTCATCTT. . CAAATTTAGA. AAATATATCA .1680* 

ATAAGGGTTG ATAAAGACGT AAGTCCAAGC TCAACATTAT CTTTGGATAA TTTCATAAGT 1740 

TAATCTCTTT TTTTAATGTG ATTTTTGCCA TTACCATTAC CATTCTTAAA AATCTTGCCT 1800 

ATTACAATAG TCAATATGTC TTTTAGTAAA GGCTTGAGAA GAATTAATAC TCCTAAAACC 1860 

AACACTGTTA CAAAAATCAT TACGGCTATA AGTTTAATTT CGTTTAAATT GATAAGAAGT 1920 

TCTGTTAATT TAATAGTATC CATTTTTTAA TCCTTTATTT TAATTTTTTA TTTGTATATA 1980 

CATTATATAT CAAAATCGTA ATTTTTGCTA AAAAAGCTTA CAGTTTTAAA AGATCTGGGA 2040 

GTGAATCTCC ATACATGTAG GCTCTTTTTT GGATATACCA TCCGTTATAA ATGGGAGTTC 2100 

TGGTGAATAG TCCGCGAGGG CCCGTAATTT CATAAACCCA ATTGTATGTA ATTTCATCAG 2160- 

AATACATAAG TTTTAATGAT TTTTTCTGCA TCCTATTATC ATTGATTTTT ACTTGAATCT 2220 
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CAATATCAAG ATAAATGGGA 




} 1033 [ 

lTTATCGT aatttttgta aaaaataaga 




*ACATCAT 



2280 



CATTGTCTTC CATATTAATA GATATCGCTT TATTCTCATA GTCAGAAGGA TAAAGTGTAG 



2340 



TACTTCTAGT TATGCTGCCA TAAGTAAAAT TTGATGGTAC TCCAAGTATA TGTTTAGGAA 



2400 



CnGGTGTTTT TTGAATAGTA TCTGATGAAG GCATTATCAA AAGATCA 



2447 



(2) INFORMATION FOR SEQ ID NO: 54: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2401 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ .ID NO: 54: 

TATTATTATA TTTAGGGAGA GAATTTATAA AATAAAGCAT AATTACTAGA ATACTTGTTT 60 

TTTCTATGAA TGATTGTAAT GCGGATCTTA ATATTAATAA TTATAAAACC AAAACTAAAG 120 

ATGGGTTTTA TGCTTTAATT TAATTAATTT TAAGGAAAAA CTAATTACCA TATTAATCCC 180 

AAATATATAA TTATTGACAA AAGTTGTATC AAGGGATATT GCCTAATATA GCAGAAGTAT 240 

ATTCTGTTAT TAAATATCTC CTAAGGAGGA TTTTATTTTT AAAATAATAG AAAATAGTGC 300 

ACTTATTTTA ATAGATATAC AAAATGATTT TTTAGAATCA GGCACTTTGC CAGTATCTAA 360 

CAGTAATGAA ATAATTTCTT TGATTAACCA ACTTCAAAAT TATTTCAAAA ACATTATTGC 420 

CACCAAGGAT TGGCATTGTA AAAATCATGT AAGCTTTTCT AACAATAAAA ATGGGGGTAT 480 

TTGGCCTGAG CACTGCGTCA AAAATACTTG GGGATCAGAA TTTCCTAATG ATCTAAATAC 540 

GAAAAGAATA AAAAAAGTTT TTTTTAAAGG AACCGATCAA TATTACGATA GTTACAGTGG 600 

ATTTTATGAT GATTGCATTA AAAAAAAACA AACGGGCCTT CAGCTTTATC TGAAAAACAA 660 

TTCAATCAAT ACATTATTTA TAACGGGACT AGCATTGGAT TTTTGTGTAA AAGAAACAAT 720 

ACTTGATGCA ATTAACTTGG GATTTCGAGT TTATCTAATA ACAGATGCTA CAAGAAGCAT - 780 

AACATCTACT CCTGAATTAA TAATTCAGGA ACTTAAAAAG CTTAATGTAT TAACTTGCTT 840 

CTCCAAGGAC ATCTTCGACA GCCAAAGTAA GCTTAATATA TAAAAAATCA TTCAATAGTA 900 

TTTAATTAGA AAACTACTAT TTATAATTAA AACTATCATG GAATGATAGT TTTTTAGACT 960 

ATATAAGAAA AGTTTATTCA CCAAAGAATG GCCTTTATAT TAAATTAAAG CCGCCTTTTC 1020, 

CTTGGTTTTT ACTTCTTAGT AAGAATAATT TTAAGATTCA TAGTTACATT TATATCTCTA 1080 

TCATATAAAG CTCTGCAATT AACACAAGTC AACTTAATAT TACTTATCCT TTGTGTAATA 1140 

CCACTTCGAA TGCCCTATTT AAATATAATA AAAGAATGAT AAAGAACTCA AATACTTCCC 1200 
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CCATGCATCA TATAAAAATA TCCATCTCAA AATGTTAAAA 
CTCTAATACC CAATGTACAG TCTATAGATA CAATAAAATC 

TAACACCTGT TTAAACCGGC TCACAATATA AAAAATTTTT 
ACTTATCTGA AAAATTGCTT TATTATGTAA GAGTGTATAA 
AGGCAGAAGT GAAGGTTAAT AAATCCCTAC AAATACAAAG 
TTGCTTTAAT TGCGACACTT GAGTATATTA ATAAAAACAA 
ACATCCTTTA TTGTTTTAAC AGTAACTTAA GGCGCAACGG 
AAACGCTTAG AAACTACTTC TATAAACTAG AAAAGCTAAA 
GACATCTAGG TATTAATATG GGCACTGAAA TCTACTATGC 
ACTGCTATAA TCTACTAAAC CAACACTTTA GGAATAAAAA 
GTGTTAATGT ATATATTAAA ATAAATTACG ATAAAAAGGA 
GTCTTAATAA TAAATATAAA AAAGAAGAAA GAGAAACCGA 
AGCTTAAACT AAAAAAATAT GCAAAAAAAT GTAATTTCGA 
TTATTAATCT TAACTTAAAA AAAGAAACAA CAATCAAGCT 
AAAAATATTA TTTCAAAAAA GAAAACAAAT GTAATTTACA 
AAAGAGATTT AATTTCAATA TTAAGAAAAA CCCAAAAAAT 
ACAA/^AAAAA GATAAAAACC CAAATACAAA ACACATATCA 
ATTTCATATT AGAAAGCAAT AAATATAAGG ATTTCGATCA 
ACGATACTAA TAAAACCGAA CCCCAAAAAC ATAAAGACAA 
. ACATACTTTX JVGATCAATTA CATAGAAAAA CCAACACAAC. 
G 

(2) INFORMATION FOR SEQ ID NO: 55: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2324 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ACAACGCCAC 
TTTTAAGAAT 
ATTTTTTAGT 
AAAACCATCC 
TAAATATCAA 
AAAAAAATAC 
GCAAAAAGAA 
TATTACTATT 
TCTTAGGCAT 
AACAGAAAGA 
CAATGTAAAA 
AAGAAAAAAA 
TAATGAAATT 
TTTTAAATTT 
AAAAACACTG 
TTTAATAAAA 
AAAATATAAA 
AATTATAAAA 
TATAGAAACC 
AAATTTAAGG. 



CGACATAATT 
TTAATTCCAA 
GATAAACTTT 
GAAGTTGAGG 
CACAAACTAA 
AACCAATCAG 
GTTTCAATCA 
AACTACTATA 
TCTAAAAAAG 
TTTCAAAGAC 
AATGGGGAGT 
AGGATTAATA 
TCCTCTTTTA 
ATAATCAAAG 
CAAAACAAAA 
GAAGGTTGCG 
AACAAACCCC 
AAGATAAAGG 
AATATATATA 
TCGGGGATCC 



1260 
1320 
1380 
1440 
.1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
.^.-?400 
2401 



(xi) SEQUENCE DESCRIPTION :. SEQ ID NO: 55: 
CAATATGACA TCCTGAGGAC CTTTTATGGA GACTTGTAAA GCTTTTTATT TCTAATGTTT 
TAGCTTTTAT AAAAACACCA ACCATGACAC ATATTGAATT TTTAAATCTA TAAACATTAT 



6©:. 
120 
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TTCCTTAAAT TTCTAAAAGT^fflTTAGGCT CTGTATTTAA AAAAATCAC^WaCCAAGAA 180 

TAACCTTTTC ATCATTTAAT AATAATGTTT TCTTGCTAAG. AAAATTTATA AATCTATTTA 240 

AAATGCTTAA TTAAGCTTAT TTGTTTTCAA ATAATTCTCA TATCCTTTTA TTAAAAACAA 300 

AATGTATTCT TCTCCCTTTT TATTTTTTAG CACCTCAAAA TCATTAAGCA AAACCTCAAA 360 

ATCTTCTTTG GTTAGCGAAT AAAGACTAGC TACAATAAAG TTATTTTCAT. TTTCTTTTTC 420 

TTTGAAAAAT TCATCTTTAG TGTCTAATTT TAGAATTTTA TTAACTTTTT CTTTGCTAAA 480 

TTTAAAATGC TCTAAGTAAA GCAAATTAGA GAAATTTAAA GGATCATTTT TAGCTATTAA 540 

CAAGGAAGTG TTTTTTACTA AAGTTAAGTA TATCGGATTA GCTAAAATTT CTTCTTCTTC 600 

GGGTTGAGGC ATAGGGCATT GATATAAGCA TGATTTTACA ATATCAGTGC TTAAAGCAAA 660 

TCTTCTTATT AAATAGTCAA AAACAAATGA ATTAAAAATA GATATAATAA ATAATTTTTT 720 

ATAAATAGAT ATTGGTGTTT TCTCATAATT TATATATATT GTAGAAACAC AATAACAATT 780 

TCTAGGAGAT AAAGTACTAA TCATGGTTCT TATATCTGTA TTTCTTGCAA TCCTTCTATA 840 

TAATATTTTT TCTATTTGAT ACTGATTGTC TTTAGTTGAT ACTTTTTGAA AGTCATCTTT 900 

ATCTATCCAT AGTAATTTAG AGCTTTCTTT TGCATCTTTG TCTTCAAAAA ATCTTGAATT 960 

AAACTGATGA ATATTAGCTC CAGAATAAAG AAATATAAAA TTTTCATTAT TATATTCTTT 1020 

ACATAGTGTT TTATACTTTG TTAAATTTAG CCCTACTCCA AAATTAATAT ATTCTTCACT 1080 

AAGAGTACTA AATTTGCTAA ACATTTTGTT AATTAAGATA AGCTCTTTAC TATCTTTAAA 1140 

TTCAATAATT GATTCTTGAA TAGGAGACAG TTTTTTAATT TGCTCTATAT CTAATTTAAT 1200 

TCCTTTATAA GGATCATCTT TATTATTTTC TAAGTTACTG GTTATTTCTT TTAAAATATT 1260 

ATCATTACTC TGAATCATAA ATTTTGCTTT AAAATTCGAT GTAGGAGTTT TAGTATTGCT 1320 

TATTTGAAAT ATTGCAAATT TAAAAAGTGT TGCCACATCT TTAAATCTTt TTTGATTTTG 13 80 

AAATTGATAA ATATAGTTAA GCTTATAGTT AGTAAATATA TATTTTCTTA GTATCCTAGC 1440 

ACTAGATTCA CTCCAAAGAG CTGAAGGAAC TAAATAGGTT AAATTTCCGT TTTCTTTTAT 1500 

TAATTTCAAA TTAAATGCTA CAAAATATCT AAAAAGATTT GGATCACCAC CACTAGCAAA 1560 

ATTTTTAAAA TCGCTTTTAT AAAGATTGTT GATAGTACCC ATACTATTTT TTTCTTCATT 1620 

GTATTCAATA . TTCAAAGGAT GATTATCTCT GCCAAGTATT TCTTGCTTTA TTTTATTTTG 1680 

TTCTTTTATG CTTAGCTTTC TATAACTGGG AATATGTTTT GAGAAAAACT CTGCTTCATT 1740* 

AAACTTAGTT TTTTCCCATG GAGGATTTCC AATTACAATA TCAAATCCTT CTTGAATATC 1800, 

TGGAAACTCA ATTCCATAAT GGAAAAATTT ATAGTGGCTA CTTAATTTTC TAATTTTCTC 18 60 

CATTTTTTCA TTATCTTCAC TAGAAATTTT ATTGCCTAAA ATATTCTCAA TTAAACTAAT 1920 
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TACAACTGCA ATATCACTAA ATTCTATATT TAAAGATTTG TCAAAAGATA ATGAATAAAG 1980 

TTTAATTAAA GAAAATATTA TTCTTAAATT ATCTATATAT TTACTTTCTT CATATTCTTT 2040 

GTATATCTTT TTAGATCTTT CTATATCTTC CTTAGTGGTA TCGTTAATAC CTTTAATTTT 2100 

TTGATAACCA TCTTCTAAAA TAGTTGTAAT TTCCTTAATT CTTTTTTTAA ATAAAGAAAA 2160 

TCCACTTTCA AATTTCTTTT TTGCAATATC AAAAAATTCA TCTTTAGTAT ATCCCAAGAG 2220 

AGCATTTCGT GTTTTTATAT GATGCTCAAT AAAGCTTAGT GGCGTTCCAA AAATAAAGGT 2280 

ATTAATCCAC AAACTTAGCA TAGTAATTTC AACCGAAATA GGAT 2324 
(2) INFORMATION FOR SEQ ID NO: 56: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2148 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

- (D) TOPOLOGY: linear ' ' 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56: 

TnAAATCTAG GATACCCCGA CAAATATTAT TTTCCAGTAA TTATGAATAT TTGCTCGTAC 60 

GACAATGTAA AGAAATTGCC TTATGACGAG CTTTTAGAGG TCAATAGACT TGCTGAGATT 120 

AAATTAGAAA AAGAATTGTA TGAATTAATT TTAAGCAAGT GAGGGCTTAG TGAGCGACAA 180 

ATTCACCATT AAATTTAAAG GGATTCTTGA TCATGCTGCA ACAAAAAAGG CCATTGAACA 240 

AGATATTTCT AAAATGGAAA AATATCTTAA ACCCAGAAAC TCCAGTTTGG GAAGCACTAA 300 

AGATATTGTA AAAAATAATT TGTCGrACAA GAAAAAAGAA CTTAGyArAC AATCTAAATT 360 

TGAAAGCOTA AGAGAGCGTG TTGAG^AA CAAA.CTAAAA ArCTTATAAA* 420 

ACAGGGCATG GGrTTTGAGA AAGCTAGAAA AGAGGCTTTC AGAAGATCTT TAATGTCTGA 480 

TAGAGACAAA AGGCrTCTTG AGTATAAAGA ACTTGCAAAA GAATCAAAAG CAAAAAGTAA 540 

AATGTTAGCG GCCTCTCAAG GAAAAGGACT TGTTGCCAAA ATTGCAATAG GTAGTGCCCT 600 

ArGGAATATC ATTAGCAACG CTATGAGTAA AGTTGGAGGA GGCCTTTTAG GTTTTGCTAA 660 

AAAAGCrGTT GAAGAAGACA CCAAAACAAA AAGAACAAAA CTTCTCAATA GTGCATTTTT 720 

TACAGATAAC GAACGAAATA TGATTATGGG AAATAAAGAC AAGAATACTA AGGGAATTCT 780 

TGACGGAATG AArGGwTTTG AGCGmGACTT AGAAAAAGAA GArTTcTtAm ATCAAGCAAG 840 

TGyCTTTAAG GGTACTyTAA GGGACyTAGA TATGTTAAAT GAAACTAATT TGAAAAACdC 90a 

aGTAGAATTT GCAGCTATGC TTAAATCCAG TGGTGCTATG AGCAGCGAAG ATGCAGTAAA 960 
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G^TOGGTGATGG AAGTGAGCTT TTtGATCTAT^RAAC 



GGCTGTTAAT AGTGTTCTTG^GGGTGATGG AAGTGAGCTT TTtGATCTAT TAAAGAAGTC 1020 

aGGTGTTGGA GACAAATATA TAGAAGATGC CAAAAkGGCy TGGCAArGCG GGGCwsArGT 1080 

AGATCTAGAG TCyAGAATTA CCAAGATGAT GGAAATGTTC GAGGATTTTA AATCTTTCGG 1140 

CCTTACAAAA AAAGTCAATA ATGCTGAGAG TATTCAAAGT AATTTGGCCT CAGCTGAGCA 1200 

AACTCTTCAA AACTTAACCA CTACTGTCTT GGACCCATTA CTTGACCTCA TTAATAAGAT 1260 
AACTAATTAC TTTAAAGACT TTGCGTTTGA AACACACATT ATTAATCCCA TAATTAATGG ' 1320 

CATTAAAAGT ATTTTTAATC TTAATTATTT CTTTGCAAAA TTAAAATCGA TGCTACCTGG 1380 

ATGGATGGGC GGAGATGAGG GTGCGGCTCT AAAAAAACTA CAAGAAGAAA TTCAAAATCA 1440 

AGACAATGCT AACAGCACAC CATAATTTTT ACAAAAGGTA ATTACTTATG ACAAGTAACA 1500 

AAAAAATTGC TAACAATGCA GCTAACAAAA TAGATATTAA TAATAAAATT ACTAACAATC 1560 

ATGATATTGA AAAGAAAAAA ATCAAGGAAA AAATyAATGA TATTGAAAAG AAAGAAATCA 1620 

GGGAGATTAC TCGAATAATA AGAGATGTAA TAACCCAAAT ATTTGCCCTT TTCGGAGCAG 1680 

ATAATTTTTT AGTGTTATTT CCTAGAATGG ATCTAAAAGG TTTTGGATAT ATTCCTCAAT 1740 

TGTTTTTTAT AAAACCAAAA AATGAACTCA TAACACGCAC TTATAATACT AGTTGTTCTA 1800 

AAAGACCAGT TATCAATTAT TATGATAGAA AAGCGGAATA TGTAAGCTAC AATCCGGTAA 1860 

TGACTGGTGA ACATATCTCA TTAAACGGkG GAATACTAAC ATCCTTATAT AAGGATATGm 1920 

TTTCTTTACT yAAAATGACT GTTTTTGGCA ATACTATGCT ACGTTTTGAC GCGCATCTTG 1980 

TAAAAGAACA ACTAGCCAAT AGAATACAAG CACAAGTCCC TTTTAGTATm TATAGTCCAA 2040 

CTTTTGGACT TAAAGAATTA GCTGTAATTA CAAGTCTTTC GTTTAAAGAT ACTCCTTTCA 2100 

TTGACGAGTT GAAGGTTAGT CTGTCAATAG AAATAGTAAA AACATTCG 2148 
(2) INFORMATION FOR SEQ ID NO: 57: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2123 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE. DESCRIPTION: SEQ ID NO: 57: 

ACATATTATT TTGTTTATTT TTACTAATGC TAAACGGCTG TAATTCTAAT GATAATGACA 60 

CTTTAAAAAA CAATGCCCAA CAAACAAAAA GCCGGAGAAA ACGTGAOTTA ACCCAAAAAG 120 

AAGTAACACA AGAAAAACCT AAATCTAAAG AAGAACTACT TAGAGAAAAG CTAAATGATG 180 

ATCAAAAAAC ACAACTTGAC TGGTTAAAAA CCGCTTTAAC TGATGCTGGA GAATTTGATA 240 
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AATTTTTAGA AAACAATGAA GATAAAATAA AATCTGCACT TGATCATATA . AAAAGTGAAC 300 

TTGATAAATG CAATGGAAAA GAAAATGGGG ATGTTCAGAA AAATACATTT AAACAAGTAG 360 

TTCAGGGAGC TCTTAAAGGG GGAATAGATG GCTTTGGTGC AAGCAATGCA ACTACTACAT 420 

GCAACGGTTC CTAATAGCTA TTAGCCCCCT ATTTGGGGGC TTTAATCTTG CTATGCTGGA 480 

AATATCTCAT CAAACCGTTC GTATTCTTTT AAGATACtXa AGAATATTAA TGGACTAGGG S40' 

CCATAAATAG GCCTCTTAAG CCCCATAAAC CTTTCAAAAT CTTGTAAATC CTTTAATCTA 600 

TTATTTTTCT TGAAATAGTT TTTTATAATC TCGGCCCAAT AGTTTATGCT TTTAAAATCA 660 

CTATTTTTCT CAAAATACGA GATTAAATCA GATTCAATTT TCTTGATATC ATCAAAATTA 720 

TTGGGGTCTA TATTCTGAAT AAAGCTTATT TTTTGAATAA TTGAGTTTAT ATTATCTTTT 7 80 

GTTGTAGGGC TATTTACCCA GTCTTTTATA TTAGACAAAG CTTCTTTAAA AACACCGTAA 840 

TAATAAAGCC TATCTTTTTT TTGTTCTTGC TTAATATCTC TTTTCTGGTT TTGAATAGTG 900 

TTATTTTTTT GAATTTGATT AATCTCTTGT TTTTGTTCTC TTTTTTGTTC TTGCTTTTGA 960 

TTAACACTAA CTTGCTTGCT AGGCATAGAA TTTTCGTTTT CGTGGTTATT GTAAATAGGA 1020 

GCTGCATCAG TATCTATTTC ACTTTCTATA CCAAGAGCTG CAACTAAAGC ATACCTTTTG 1080 

ACATAAGTAA TGCCTGAACC AAACATCTGA TACACTGTAT TTGTAACTTT AGACCCATTT 1140 

TCATTGTTCC ATTGTAAATT TTCTGTAGGA ATTCGCGTAT CAAAAGAAAA TTCATATCCA 1200 

GTACTTGTAC TGTAGAATGT AGTCCTAATA TAATCAACTA TGCCATATTG ACCCTCTATA 1260 

GAAATTGGAT ATTGCTCAAT ATCAAGCTCC AAATTGTGCT TTTTAATAAC ATTTTTAATT 1320 

TCTCTAACTA TTTCATTGAA ATTTTGATAT TTATATCCAT ATCCTTTAAG ACTTTTGTCA 13 80 
ATCGGTGGTA AASVTGATTTT'-TASGGTTTTC- ATATCTTTTC GGAAGCTTAT TTTTGCTTGA » - 1440 

ATATTATTTT GTATTTCTTG ATTATTGTTT GAAAGATTTT CCATCTTTTT ACTCCTATGG 1500 

TTATTTATAA AAATAAGTAT ATAGCAAAAA CTATTTTTGC CAACTTTTTT ACAAAAAATT 1560 

TTACAAAAAA ATAGGGCTTA GCTAAATTCT CTATTATCTA CTAAAGAAAT TAGTTAAGCC 1620 

CGTGCTAAAA ATTTTTTTGC AAATTACCAT AGGTAGTCAA AACTGAAAAA TGTTTAAATA 1680 

ACTACGCTGT TTGTAGTGTA GCCCAATTTT AAATTAAAAT CAATTTATAT TTTCACTGAA 1740 

TTAAAAATTT CTATATTAAT TTAACAAAAT TAATAATTAA AATTTAATAT TTTTTTAGAA 1800 

AAGTATTTAC TTTTAAATCA AAATTTTGCA TTATAATAAT TAATTATTAA TTACCATAGG I860' 

AGAAAAAACA TGAAAGGTTT TTCAAATACC ACAAAAAaTC CCACTTGCCA CAACAAACAC 192t) 

CTACACAAGT TAATATATCT AGCTTCAACA CTAGATTTtC TAAACAAAAA AGaTAAGAAA 1980 
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TACACACAAC AAAACATACT CTATTACTAT AATGrrAATC TAAAAAGAAA TGGkCTAGCT 2040 

CCCACTACTC TAAGrACmAT GgCAAAATTA TCTTTACAAA TTAGAAAAAG TATTAAAAGT 2100 

CACAACTAAT TACTAACCCn AAA 2123 
(2) INFORMATION FOR SEQ ID NO: 58: 

(i) SEQUENCE CHARACTERISTICS: ..... 

(A) LENGTH: 2093 * base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58; 

AAAAAAGTGC GCCGTGCGGC GGTGnAACGA CTCAATAGTT ACTAATAATC CATTTCTAAA 60 

CTTAGAAATG CAAATTAATA ATATTTTCTA AAGTATTTTT TGTTTCCTCA TAATATGTTT 120 

CTTTTACAGA AGGTTCTAAA AGTTCATTTA TAAGAACTTT TACACTATTG TAGTAATGAA 180 

TTTTTCCCTT TATGTAAAAA GAATATTCCT TATAAAGCAG TTCTTCTACA TCTTTAAATG 240 

TATTTCTATT TTTTAGAAAC TGATTTTCTA TAATCGAAAT ATTAAAGCTT TTATTTCTAA 300 

AATCTTTAAT ATCATTAATG GTTTGCATTA AAATACTTAA ACTTTCTACA GAGAATCTTT 360 

CTACTTGAAC TGGAATTATT ATATAATCTG TAACATTCAA AGAATTTTTT AAAATAAAAC 420 

CCAAGTTGGG TGGGGTGTCA AGTAAGATAT AATCAAAATT ATAATTTGTA ATATTTCTAT 480' 

TCAAAATATT TTCTAAAAGA AGATCTTTAT AATTTAAAAT TTCTGAATTA AAATTTTCTA 540 

AAATAGGATG AGATGGAATT ATAGAAATAA AATCATTAAT TTTATTAATA CACTGTCCAA 600 

AATAAACATC TTTTTTTAAT AAGCTGTAAG AATTGCATTT ATCAATGTTG AAAATATATT 660 

TACTAAAATA AGAACTTAAA GAATTCTGTG GATCTAAGTC AATCAATAGA ACTTTTTTGC 720 

TTAAATCTTT TAATATATAA GAAAAAAGTA TTGTTAATGT GGTTTTACCT ACACCTCCTT 780 

TAGGGCTTGC AATTGTTATA ATGTTTGATT CTTTTCTATC CATTTGTTTA TTATTCCTTC 840 

CTCTTTTATT TTTTTATTGT AAAATTCGTA AACTGTTTTT TCCATG.TTTT TTATATTTTC 900 

TAATGTAAAT TTATAGTATT . TTGTTTGTTT TTTTTCTTTT CTTAGTAATG TCCATAGGGA 9 60 

CTGAACGTAA CACTTAATAG ATCCTTTTTT AAATACATAT TCTATGTAAT ATGCCTTTTT 1020 

TACTACATAT TTTATATTAT TATTGGCTAT GATAAAAAAA GGTTTCTCGA GATTATCCCA 1080 

ACCGTATTTT ATGCCTAAAA ATTTTjl^ATC TTCTTTTATT GGAAATAGAT TGAAAAAATT 1140 

CCATCCTCCA GTATCATTAA ATTTTTGGAA GGTTATCCTA AGACCCTTTC TAGTAATTTC 1200 

AAATTTGATT AAATGCTTAA ATATTATTGA ATAATATGTT TTTTTATTGT CCTTTTCTTC 1260 
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TATTTTATAA AAGAAGATTC TTTTTTTTGT TTTCTTTTTA AGATTTCTAA ATCTTTCTGT 1320 

AAAGTTGTTC AAATTTTTTT CCTTTTATAA TTAGCTAGTA AATCAAATAG AAATGTTTTA 1380 

TTTTGATTTA TTTTCCATTT ATTGATGTAA ' GTGTCTTTAA ATTCTCCTAC AATTTTGAAG 1440 

AAATCTGTTT CGTAGTGAGC ATTTTGTCTC ATGAAGTGAA TTTTATTTTT ATATTTTTTT 1500 

AGCTTtTTTA AGTAAAACTCJ TTTTATATCT TTTGTTTGAT AGTCGTATTT TAAATGCTTG 1560 

TTGAAATCTT TGTAATTTAT AAATAACAAT GGGGTTATTA TCAAGGCTGG TGGTGGGCCA 1620 

CCAACCGCAA TTAATGCATA TGCCCTCTCT GATTCATTTA CAATCAATTT TGCACCCGAA 1680 

GATGAACATC AAGATCAAGC TAAACATCCC AAACAAGAGT ATTCTATTAA TTTGATAAAA 1740 

GTTGCAATTT TTGGCAATAG AGGCCTTGAG AAAACAGTAA CACCTGAAGC TGGTGGTTAA 1800 

GCCTTGGGCA ATAAAAGGAG TTAAACAAAT GGCAGACACA ACGCAATTAT TAAAAGATTA 1860 

TCAAGATAAA CGAgTAAACT TGAAAAGTTT ATGAAAAATC CCCAGTATGA CGCTGGTTTG 1920 

CTTAGCAATT CtGTA.GAGTT TAGAGATAAA AACATACAAT TTTTTGCCTC TGGAGGCACT 1980 

AGAACCAGCA AATTtGACAA aTTAGAAAAT CATCCATTTT CtGGGTATCC ATACmAGCGg 2040 

GGaTAAAAAG AGTTATTCAA GAGGAAAAAG CTGATCAAAT TCACTATGGA ACC 2093 
(2) INFORMATION FOR SEQ ID NO: 59: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2 019 base pairs 

(B) TYPE: nucleic acid 

(C ) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi)- SEQUENCE. DESCRIPTION := SEQ -ID no/.- 5.9-: . . 

GTCTTAGTCA TATTTTCATT AAGTCTTTTT GCTTATTCTT AGCAACCTCT AGCAAACTTT 60 

TAGTACTACT CATTGAAGCT TTAGCATCAG CCATAAATTG GTGGTAGCCA GCATAGTAGT 120 

AGCTCTCATG CCTTGAAGCA TTGCTATTAC TTAATGCCTC TTCTAAAGCC CGATCTGCTT 180 

TTCTTTGTGC ATACTCAAAA TCGTTCTTAG CTCTTTTTAA, AGCAGCAATA GCATCATTGC 240 

AATGAGTATC AGCAGAAGCA TGATTACTCT TAACCTTAGC AATAGCTTCT TCTAGGCTAG 300 

GCAATAAGGC TAAGTTAGCT TTACTAGATC CCACACCTCT TCTAGTCTGC TCTAAATAAG" 360 

ATTTAGCTGT ACTAAGTAAG CTTTTTATCT TATCAAGGCT TGCTTTTACT TTTGCTAAAT 420 

CTTCATTTAT TCTATTGTAC TCTTCTTTAG AAGATTCAAT TTCCGTCATA ATGTTTCTAG 480 

CTTCACTAGC TTCATTATCT TGGATATTAA CTTGTAGAGT ATGGTTGCTG CTACTATTAT 540 
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CATTTTGCAT ATCGGGTTGC ATGTCTGCCA TCAAAGGTTT TTTGCCTGTA TCTTGGTCCA 600 

TATAAGTATT ATCTACACTT CTAGGGTTAC GACCACTTCT CTTGCTGTCA TCGTTACTCT 660 

TTAGAGTATT AAAAGACCCA TTATTGCTTT TTAGTTTGTC TATAACCTGA TCGGCGTTGT - 720 

ATGTAATCTT CTTGTATAAT TTACAAGAGA TAACACTGGA AAATAAAATA GTTAGAATAA 780 

ATAATTTATT AATTAAATTC ACCTTATTAC TTCTCTTTAG AATCTGATAT TCTTATATTA 840 

AAAAATATAT TGCATTTATA ATTTATAAAA TGATTAATAA TGCATAAGCC TU^CTATAAA 900 

TCTGAAAGAA TTAAAGTAGT GTTTGTAAAG GCAAGATAGG AGTGAGATAG TTAATTTAGG 960 

TAAGCTGATA TAAGTTTTTC TAGTAAATAG AGTTTCATAT ATGATTAGAG ATATTAAAAA 1020 

AACTAAAGCC TACACTGGAA GTTTTAAAGC TTTAATATAT TTTCTATTTC TTTTCTGCAA 1080 

GAATTTCCAT ATTGAAGAAA ACTAATAGCA TTTTCCATAT ATTTAATGCA TTCAGTAGCA 1140 

AGATCTATAG CTCTTTTTGC TAAATCTTGT ATATTGCGTT TGTTAAAATT ACTGCCTAAC 1200 . 

CAGTATGAAT TGCCATTTTC ATTGTTTAAT CTTTTATAAA TAGAATCTGC TAGTTTATCT 1260 

CGAGCCACAT CTAGCATATC TTTAGCAGAC CCCCAAGAAT TAGTTGCTTG CTCCATAAAA 1320 

GAACGCATTT CTTCTAATTT TACCCATAGT GTGGCTTTGA CAGACTTTAT TTTTCTATTT 1380 

AAAGGAGATG TGCTTAGATT AGAAAATAAT AAATCTGACA TTTTTTGATG AAATTCTTTA 1440 

AACTCAAGGA GTGTATTGTT TAAGTTATTT TCAGAATTAG CACGATTAAT AAACTGCTCT 1500 

GCATTTTTAA TTTCTGAAAG AGATGTTTGC TCATACTCTT CTTGTGCAAA TTCATCTAAT 1560 

TTAGCTTTAA TTTCTTCTTC TGAAGGAATA GCAGGAGTTT TACTTGTTGT AGTAAGGCTA 1620 

TTTTTAAAAT TACTTTGTTC AATTGGATCA TGTTGTGGAG TAGCTGATTT ATTTTCTTCC 1680 

ATCTTTACAT TATTTTGAGC ATGCGAGTCA TTTTGCATTA TTGCTGGACT TGAATTTGGT 1740 

AGGGATTCTT TATTATTTGC ACCAGGATCA TCTGACATAT GTTGATTAGA ACCTACTTGT .1800 

AAGATTGGAT CATAAGTTTT TTTATTTGAT GATGTAACGT CTTTAGGAGA TTCAATTTCC 1860 

TTACTATTTT TATCTACTGA AGTATTAGTA GTATTTTTAT TTTCTTGATG ATCTTTTAAT 1920 

GCTAATGCAA ACTGTTCTAT AGATTTTTTA GATAGAAAAC CAGAACAACT TTCAAATAAA 1980 

AAAAGAGAAC TAAATACTAA ATTAGGTATA ATAAAAATT 2019 
(2) INFORMATION FOR SEQ ID NO: 60: 

ix) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1907 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 60: 

AGAAAAACAA AATCTATTGC TTCTTCACTA AATCCTATCT TTAAAAATTC ATTTTTTATA 60 

CTTTCTATAT TGTATGTTCT GTAAGTCAAA CTATTCATAA AATTTCCATA TTATCCTTTT 120 

AATTCTTTAT ATTCTTTCAT AAGTTTTTTA ATTATTTCTT TTCCATCACT AAATAATTTA 180 

TCTAACATAA ATCCTGTAAA TTTAGCATTA CTTTTATAAA AATCATAGCT TTCTTGTCTT 240 

TTAAGCTGAA ATCTTAAGGG CTTTATCGGG TTTTGTTTTG ATTTTTTTAT TGTTTTGCTC 300 

TCTTTATTTC TTAATACAAT TAACGTTTCC AGTATACCAT TTTTTATTAG AAATTCTTCT 360 

TGTATAATCC CATCTTCTAT TGCATTAGCA ATTTTTAAGT AATTATAGAC CTGTGCTCTT 420 

GCAAGTCTAT AATCTTTAGA AAAAGCTTCA AAACTTTTAT AACCATCAAA CCTATAATAA 480 

TGATTGTCTT TAATTTCTTT TAAAATTTTT AAAGTTTCTA ACTTACAATA GATTTCCTIT 540 

TTAGAATTAA TTTTTAACTT TTCTTTTAAA GAATTATAAT GATTTAATAC ACTATCAGTA 600 

ATAATATAAT TTTCATTATC ACTTAAATCT CTTTTATTAA CCTTAATATC CAATTTAAAC 660 

TCCTTTTACA TTAAACTGTC TAATTATTAG ACTTTATATT TTTTTTAAAA AAATTTCTAA 720 

AATATTTTCA TATTCTTTTA TATAATCTTT ATTTAAATCA AAATTATTAT TTTCTGCTAT 780 

TCGTCTATTT AAGTCTTCTC TTTCAGATAT TGTTCCTAAA AATCTATCTT TTGTTTTTAA 840 

TATTTCAAAT AATGTTTTAT GwGTTCTAkT TwwwtTaAAT CTTGTTATTA TCAAAAATAT 900 

AGGTAAAAAT AAATTTAATT TTCTTACAAA GAAATTAAAT AAATCTAAAC TTTCCACTGC 960 

CCACTTTTCA GCCGTCATTG GAATTATTAC ATAGTCACTA CATAAAAGAG CATTTTTTAA 1020 

CGTAACATCT AAACTGGGAT TTGTATCGAT TACTATATAG TCATATTTAT AATACAAAGT 1080 
TCCCAGGGTG. GTPTTTTAACA. AAAAATCTTT ATGTTCGATT TTATCTTCAC TAAAATTATG ^--.^11-40 

TAGCGTAAGA TAGCTAGGTA TAAGATCAAG ATTATTATCT ACATTTATAA TGGTACTATC 1200 

GATATCTACA TTTTCTTTCA AAATCTCATA AATATTAAAT TTGGTAAAAT TAATACCTAG 1260 

TTTTTCTATT TTTTCGTAAA AATAACTAGT AATAGATGCT TGAGTATCCA TATCAATTAA 1320 

AAGAACTTTA TTATTTTTTG ATAATAAAGT AGCCAAAATT ATCGCACTTG TGCTTTTACC 1380 

TACACCGCCC TTAATTGACG CTATTGTTAT TATTTTAGGT TTTTTATTAT CCATTTTATT 1440 

AGTGGTCCTT GTTCCGGGTA TTTCTTCCCA TAAAATTTAT ATACTTGTTG TTCTAAATCT 1500 

GTAAACATAC TAAATAACAC TTTGTTGTAG TGATTGTTTG TTCTTTTTTT ATCTAATAAA 1560 

CGATATAATC CCTTGAAATA GCAAAAAACA CTTCCTGCTT TAAATCTAAA TTCCATATAA 1620 

TATGCCCTTG CTAATGCATA TGCTTTTCTA GCCCCGTTTA TTTGATACTT TATTAACGGC 1680 




1740 



GGGTACAAAT GAGTTTCTTC AACAATTCTT TCTCCATTAA ATAAGGCCCT CAATGATAAT 



1800 



CTAAATTCGT GTTTTTTCTC ATAAACTCCA AATTTATAAA TATCCATCAT TATTTTTGTA 



1860 



TGGTACATTG CTTTACCATT TTCTTTTTCA ATTAAAATAA AGCGTTC 



1907 



(2) INFORMATION FOR SEQ ID NO: 61: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1907 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 61: 

GAAAAGATAT ACGTAGAAAT AGAAAGACGT ATTGAAAACC ACAATTTTTT GTTTTACAAA 60 

GATGAATCTT TAGTACAACT ACAAGACGCA CTTTCTAGTG CAACAACTTC TTTAAGTGCA 120 

CTTACTCAAG GCAATAATGA TAGAGGAAGT GGCATTTTAT CTTCTTTTTT AAGAAAACAA 180 

AATTCAAACA ATCATAGTAA AGATATTTCT AATTTACGTA GTCTTAATGA CTCATTGGCA 240 

CAGGAACTTG CTAGGTTAAA AAGCAATCTA AATAATGAGG GAATGTTTTA TACAGCTACT 300 

CCGAGTGCTA GTTTAGAGGT TATTAAATAC GATCTTAGCT ATTTAAAGGA GGCTTTAGCA 360 

TTAATTAAGG CAAAAATTGG TGCAGATACT AAAGAACCCC TAACTAGAAG TTTTAATGAG 420 

CAGGCTAAAG GACTAGGGAA TGATGGTT^AA GGAGATAGGA GCAATTATTA CGATTTTCTA 480 

AAAGGTGTAC AAGAACAAGT TGAGAACTCT TGTAATTTAA AACTTACAAA GTATTTTGGA 540 

CTTGATATGA AGTTTAATTC GCTGATTATG TTAAGTGAAG AACAAAAAGT GGAAAGAGAT 600 

ATAAAGCTAA TTGAGCTTaC AGTAAATATA ACCAGCTTAT ACAAAGTAGC TCCTTgATAA 660 

TGAGGAGTTA GCGATTTaAA AGAGAAATaT TCTCATTTtG AGAAAAGGAG TTAAAAAGTG 720 

ACTGAGAAAG AAGAAAAAGA AGACCTGCAG GCACmAGATA AAGArGAGCa GCAAaTTAaG 780 

GCtGATACTA AAGTTATAAG TGCGCAGGAA TTTGAAGAGT ACATGCGTTT TAAAGAGCAG 840 

GCAAATAGTA AATCTAAAGA GACAAGTCGA GATTTAAGTA TAAATGAACG AATAACAAAA 900 

GAACTTGCAG AAGTTGAAGA GCGGGAGCGT ATTGAAAAGC AATTGTTACT AGAGGCTGAG 960 

CGAATTAATG AAATTGATAC ACTTGCAAAA GCACATCTTA GCAATCATTT TAACAAAGAG 1020 

GTGCTACTTG CAAAAGGATA TACATTAAAA GACATTATGC AAGCAGAACG TAGAGAACTT 1080 

GTACGCAAGT TCGTTCCAAT TGAGCAAATT AAAGCTATTG CCAAAGTATC AGACATAAGT 1140 

CATATmGATG GrGAGATATT AGAGCAACTT GTTTCTTTAG CAAAAGTGAA TATTAAATTA 1200 
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AGAAAAAATG CGAGTAGCAA TTCTTCTTCT GTTGACTCTA TTAAGGGGAA TATTGCTATT 1260 

AAATCAGAAG AAAGAGCAAG TTTGCTTAAT TCTAATTTTG TACCTATTAA TTTCACAGT^ 1320 

TTTGTACAAG CGATAAGTAA TACTTACAAG CAAAGACGAA TTCAATTTTA TGAAAATCTA 1380 

AAAAGACATA AAAGAACAAG TATTGCTTAA AGGAGTTTTT AATGAGCGAT GGTATTACAA 1440 

AAATAAAAGA AGAGTTTGAT AAAAAAGTTG CAGAAATTAA AGCATTAATG AAAAATCCTC 1500 

AGCAAGATrC TGGTTTGCTT AGTAATTCTr TAGATTTTAG AGATAAAAAT CTAATTTACT 1560 

CCAATTCGGA TGGAGTTTTT ACTAGTAGTA AAGACAAAAT AGAAAATTAT CCTGCTAAAG 1620 

GGTATCCATA CAAGCGTGGA GTCAAGCTTA GTTTTAGTGC AGATGGTACA ACAGAACTAG 1680 

AAGTTGAGGC TGGTGGTGGG GATGACTTGT ACGGAATATG CACTGATATA nATGAGTTTA 1740 

CTGGCATGGC AACTGTAGTT CCAATTACAA ATAACTTCAC AGGGTATTTA ACATTTAAnA 1800 

AAAATGGACA AAATGGTGTG AATCCGGGTG ATAAGCTGCA TTTTAATGCA CnAGGAGAGC 1860 

TTGAAAAGAA TGGGGGAAAT GATAAATCTG TTAATGCTAT AGCnCTT 1907 
(2) INFORMATION FOR SEQ ID NO: 62: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1902 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 62: 

CGGGCATTTA AGCTCTTTTC TACATTGTCT ATTTTGATAT TCAAACCATC TATTTTTAAA 60 

TTTA?VATTCT TTTCCACATT. GTCTATTTTG GGATGTAAAT TAGATATGTC - TTTTTGGAAA - 1-2^- 

TTCTTCTCTA TATCAATTAT TTTCTCTTTT AAAAATTCAA AGTTGTAATT ATCATTATGC 180 

AGAAAAACAA AATCTATTGC TTCCTtGCTA AACCCTATAT TTAAAAATTC GTTTTTTATA 240 

CTTTCTATGT TATATGTTTT GTATGCTAAA TTGTTCATAG ATTATCCTTT TAATTGTTTA 300 

TACATTTTTA AAAGTTTACT AATCAAATCT TTTTGATTTT CAAAAATCTC TTGCATCATA 360 

AAACTTGTAA ATTTAGCATT GCTTTTGTAA AAATCATAAC TTTCTTGAGT TTTAAGTTGA 420 

AATCTCAATG GTTTTATTGA GTTTTGTTTA GATTTTTTCA ATACTGGACT TTCTTTATCT 480 

TTCAATACAC TTAATATTAA TCTAAATCCA TTATCTAATA CATATTGTTC CTCAATAACT 540 

CCTGCTTCTA TTGCATTGGC AATTTTTAAA TAGTTATACG CTTGAGTTTT TGCAACATCA 609 

TAATCCTTTA TAAAAGCATC GAAACTTTTG TATCCATCAA GTTTATAGTA TTCATTATCT 660 
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TTAATTTCTT TTAAGATTTT CXTACATTCT ACTCTATTAG AAACTCCTTC fCTAAGGTTT 720 

ACATACAATT TCTTTTTCAA AGTATTATAA CGATCTGTTT CAACACCATT TTTACTAACA 780 

TTAGAAGAAT CTACAAGTAA TGCATTCCCC -TGAGAATCAA TATCCCTTTT ATTGATTATT 840 

AATTTTGTAT TATTTTTCAT AACAAGCCTC CTTAATTATA AGTTCAACGC GTCGAACTTA 900 

TAATTATAAT TATTTTAATT TTGCATAAAA ATTCATTAAT GAATTTTTAT ACTCTTTTAT 960 

ATAATCCATT TGAAAATCAA AAGAAGAATT ACTAGCAATT CTTCTATTTA AATCTTCTCT 1020 

TTCTGATATC ATTCCTAAAA AATTTTCTTT GGAGTTCAGC ATTTCCAACA ATTGCTTATG 1080 

TGTATTATTT TTTTTAAATC TCGTTATTAT AAAATAAGTA GGCAATTCTA CACCTATTTT 1140 

TTGCATAAAA AATTTCAAAA GGTCAAAACT TTCAATTGTC CATTTTTCTG CTGTCAAGGG 1200 

GACAATTACA TTGTTACAAC AAACTAAAGC ATTAGTTAAA GTAAAATCCA AACTTGGGGG 1260 

AGTATCAATT ATAATAAAAT TATATCCAAC ATCTATATGT TTAAGCTCTT TTTTTAATCT 1320 

AAATTCATCA AAAGTGTGCT TATAACCAAA AGCATTTATA CTATGTAAAG TCAAATAACT 1380 

AGGTATTAAA TCTAAATTAT TCGCTACATT AACGATTGAT CGATTAATAT CTAATTTTTC 1440 

TATTAAAACT TCATATATAT TATTTTTTCT TAAATCTATA CTGGATTTTT GTATATCATC 1500 

ATAATAATAA CTAGTGGTGG ATGCTTGAGT ATCTATATGT ATTAATAATA CCTTATATTT 1560 

TTGAGCCAAT AAGGTTGCAA ATATAATTGC ACTTGTGCTT TTACCAACAC CGCCCTTGAT 1620 

TGACGCTATT GTTATTATTT TAGGTTTTTT ATTATCCATT TTATTAACGG TCCTTGTTCC 1680 

GGGTATTTTT TCCCATAAAA TTTATACACT TGTTGTTCTA AATCCGTAAA CATACTAAAT 1740 

. AAAACTTTGT TGTAATGATT ATTTGTTCTT TTTTTATCTA. ATAATCGATA TAATCCCTTG - 1800 

AAATAGCAAA AGACACTTCC GGCTTTAAAT CTAAATTCCA TATAATATGC CCTTGCTAAT 1860 

GCATATGCnT TTCTAGCCCC GnTATTTGAA CTTATTAATG GC 1902 
(2) INFORMATION FOR SEQ ID NO: 63: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1761 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 63: 

AAChGGCCCC GGAAGTTAAA GCCTTGTGGG nCCCATGCtC TAGTGGATGA CCGTTCTTTT 60 

AGAGCCTAAA AAGCTATCAT GGGATGAAAC AAGAAGCTAT TTCTATAATC TTTGATTTAG 120 

AAATAGCAGT TCACATAAAG ACGCTTGATA TTAATTTAAA TTTAATCTAT AATATAAATG 180 



wo 98/58943 PCT/US98/12764 

1046 

GCGTAGTATG AATGTAAAAT AATTTACGTT TGAGCTGCCT TATGGAATCA TTTACAATTG 240 

AAGGGCTTAA AGAAGTTCTT. TAGCAAGAGA GTTTCTTTAA GCCCTAATAA TATTTGAACA 300 

ATCTTTTTCT AGGTAAATTG ATCTTCAATA GGATTTTTTA AACGACAGTT GGAATCCGTT 360 

TATTCCAATG TCAAAATTGG GTTCAACCCC CGCAAGTGCA ATGCCGAGCC TTTTTTTAAG 420 

GTCTGCGTTG TATGTATTAG CAAATTTAAA TGGAATAATA ATTCCAGTTA TGTAGGATGC 480 

TACAATTGTG AGCCCTCCTA TTCCTGATAA TACTCCTCCG GTTATTACTG TTGCTGTGCT 540 

TTCTGTAACG CCTCCAATAC CTCCTACGAT CATGTGTCCA GCCATTATAA GTATTCCTTC 600 

CAAGCACTTG AGAGCCAAGT AGTGCACCAC CACCAATATA ATCTCCTTGA ACAAAAGATC 660 

CTATCCCTAA AGACAAAAAG ATATTCAAAA GTAATGGTGC TAGTATGGTT GCTTTTTCGC 720 

TTTCATATTT CATTACAGTC GCGATATCTC CACTCCAACA CCTTTTTCAA GTTTATCTTG 780. 

TGCAAAGATT TGCATTGTTA AACTAAAAAT TAATATTAAT GTGAAAATTT TTTTCATATT 840 

AATATTACCT CCTAATAATT AAGTTTTGAT AAACAAATGT TAGCACAATT TTTAGATTTT 900 

ATTTATGGAG TTGAATCTTTT TCTTAAAGAT ATTGTTTGAA TTTCTTTGCT GTTCTAAGCA 960 

GATTTTAATG TAAAGTTTTC ATTAAACTCT TTTAAATTTG AAATTATGCT ATCTATTTTT 1020 

TTTGTATGCC AATTGTATAA TGAATTGTTT TGATGACTTT TTCGAGATGT TCAACTTCTT 1080 

TTGAGGGCAT TTCTCTGCCT TTTCTATAAG TTAAGTAACT TTTTAGAGTT TGCCAACTCC 1140 

CAATAGTATA GTTATACACC TCTTTGGAAA CATTAATAAA TCTAGAAGTT TGGTTATAGT 1200 

AAAGTTCATT TGTTTCTTCT TTATAAAAAA CTTTTTCTAT GATTGAGTTT TGTTTTAGGG 1260 

TTTCATCTAA AAATGAAAAA CATTTTCCAA TGTTGATATT TATTGTTGGA ACAACTTTTA 1320 

CTAAATCAGA^.ATTAATGAGA ^TCTC TGTTACAAAT ATGTCAGAAT . .1380 . 

TATCTACGAA AATAATTTTA GGAAAGTCTA TTTGTAGGTG TTCGTAGAAT CTATCTCGAT 1440 

AGATATTTGA ATAAAGAATT GCGTAAATAT AGCCAAGTAT TTCTTCTGCA GTAAATTTTT 1500 

TATTGTATTT AACATCAAGA AAATGTCTAA ATTTATTTTT AAAGTTTTCT TTTTTAACTC 1560 

TCTCAGGTGT TTCGCTATCT TCTTGTATAT AAATTGGGAA AACATATCCT AGTGGAATAA 1620 

TGCTTAATTC TGATATTTTA GAAGTAACGA AAGCATGAGA AAAACGATCA " GTTTTGGATA 1680 

GTCTTGTTGT TATTAGTGCT ATATTATTTT GAATTTCTAA GATATGTTTC ATTATTTTAT 1740 

AACCAGGCCT AATTATGACC C X 1761 

(2) INFORMATION FOR SEQ ID NO: 64: ' ■• 

ii) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1717 base pairs 
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(B) TYPE: nuKeic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64: 

GCATCATTTC TGAGACTGTT GTTTTTGTAG ATAAAAATTT TCCCAAATAA TATTTAAGCA 60 

ATACAAGATT TAGTAAAGCG TATATTTTTA TTTTTTGATT TAATTTCAGT TATTTTTAGG 120 

ATTTTTATTA TTTTAATCAT ATTTTCTTTA TCAATATTTA ATGTTAATAA AATTGAAATA 180 

ATTTCTTTAC ATAAAAAGTC ACATTTATTG AAATGCTTTA TTACTTGATA CTTTTCTATT 240 

TCGTTAATTT TTCTTTCTTC TTTTATATTA TTATTACAAT TCTCCAATTG TACACTACCC 300 

ATTTTTGTAT CAGAATTTTT ATTAAAATAG TTGGCAACTC TATTTTGAAA TCTTTTTTCT . 3 60 

TTTTTTTCTT TAAAGTGTTG GTTTATCTTA TGGTAACAAT CTTTTTTAGG ATAATTAAGC 420 

TTATAATAAA TTTCTGTACC CGAATTTACC CCCATATGTT GATAGTAATT TGTTGTGACT 480 

TTTATTTCTT TTTGTAGTCT ATAAATATAC TTTTGCATAG TTCTTAGTGT AGAAATAGTT 540 

TGCCCGTTTT TTATAGATTT TCATTGAAAT AATATAATAT GGTTTTTGGG GTATATTTTA 600 

GATTTTTGGT ATTTAAATAG CTTGTAGAAA TAAGAACTAT CAATTTATAT TTATATTGGT 660 

TATAATTTAG AATATTACTA GATTAATATA TCTAGACTTT ATTTTCTATT TAATATACAA 720 

TTAATTAGGA AGCATTATGT GCTCCAAATG GATGATT^CC AGATAAAGGG CTTTAAGTGG 7 80 

CTTAAGGAAG ATAAGTTACT TAAAGCCCTT ATCGCATTTA TACTAATTTC CCTAATTTAC 840 

GTTTTATTTT GTTTAGAGCG TTATATTATT AATTTTTAAT CATAAAATGG AGGATTAGTT 900 

TTGTAATTGT ATATATTTTT AGCTTTAATT GTTCTTTATT AGGCCTTTAA TACTCTAAAG 960 

TATTATGCTA TTTCGCAAAA ATAATTTTCT GGATTATATT AGCTTACATA TTAGGATGAG 1020 

AATTATAAAT TTTAGTGCAA CAACCTTCTA CAGGGTAAAG GAGTGTATAA AGGCCTCTAA 1080 

AGCTTTCATT TTCTTTATTT GTGGAACATT TGAAGATTAC TTTTGGATTT TTTCTAATAT 1140 

TTCAAGATAT TCTAACAGGG TTTTAGAATC AACTTCATGT TGATTAGTTT TAGCTAGAGC 1200 

CTTATTAAAC TTGCTTCTTA TTAAGGAATA AGCATAATTT TTATTTGCAC TATGGAATAA 1260 

TTTTTTATTC ATATGATCTA GTGTTTTGAC AAGAATGATT AACTTATTCT TAGCAAATTA 1320 

AATTTGCTTT GTTATTCTTG CCAATGTATT GTTAATTACT CCATCCATAA TGAATTAGCC 1380 

CCCTATTATA TTAAATTTAT ATTATAAATA TAGCACAGTA TTTTTTTAAA\tTTTTTTAGC 1440 

GTAAAACAAT ATATTTCTAA AGTTTTGCAT AAGCTTATTT TATAATGTAT TTATAATTAA 1500 

GTAGTAGTGA TTTTTTGTAA AAATTGTTTT AATTCTTCAT AGAATAATAC GTAGTAGTCT 1560 




1620 



GGATTTTTCT TAAAATAAAG TTTGACTATG ACGGTTATTT CTTTTTCTAA TTTGCGTTTT 



1680 



ATTTATATAT TTTTTAGTTT TAATTGTTCT TTATTAG 



1717 



(2) INFORMATION FOR SEQ ID NO: 65: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1566 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQj ID NO: 65: 

AGnCACGTAA AATAACTTCA GTTCATATTA TCATATAATA AATAAAACAT TAAGTACAAT 60 

AACCTAACAT TTAAAAAGGA TGTACATTTT AATACAGAAA CTGAAGCTGT TCAACTACAA 120 

TTATTGCACT TGAAATTTTT TATATTTAAA TAATAATACA AATAATTATA TTAACAAATA 180 

TCAATTAAAT TTATTTTTAC ATCATATAAT AGTGCTATAT ATTGTATAAT ATGCTATATA 240 

CTTGAAACTA AAGGGGGGGC ATATTAGTTA AGATAATATT CTTATATTTT TTATTAAGGA 300 

GACTAATATG AAAAAAATAT CAAGTGCAAT TTTTACAATA ACTTTTCTTG TTCTTATCAA 3 60 

CTGTAAAAGC GATACTAGAA AAGCTATTAA TTCAATACAA ATCCAAAT^T TTACTTCCTT 420 

TGATGGGTTG ATTGATGGCT TTCTACGCCT TAATTCAAAT CCCAAAAAAT CTGAGAGGTA 480 

AAAGATTGTT TTAACAGCAT GGCTAAAACA TTAAATAAGG CCAAAGACAA ACTTGCTAAA 540 

TTCATTAGTG AAAAAGGTGG CAAGACAACC GAAGGAAAGA ATACTGATAC TGCTAAAGAA 600 

^ GATAATAGCA CAGTAA^ TATTGATGAT GAAATAAGTA .AAATTAACGA TATGATGGGA ^ ,6^0. 

AAAATGATAG ATGCTGCTAA TACCATTGTT GAAAATGTAG CCGAAACCGT AACTGAAGCT 720 

aTGGGAGAAG TTGTCGAGGT TAAGAGTATT GGTAATGTAG CAACCAAAGC CGATGTAAAA 780 

AGTGTTGTTG AGATTGCTAA AGGAATAAAG AAGATTATTG AAGCTGCTGG TATTGCCGAT 840 

AAATTAAAAG CTGAAGCCGA TAAATCTACA AAGCCAATCA GCGAAGAAAG TAACAACAAG 900 

TAAGCGGGCA AGATGTTCTC TGGGAAGCAG GGTGATCAAG GTGGTCGAGT TTTCGATGAA 960 

GTCATTCCAC CTGAGATTGG AAGAGGAGCT AATCCATTTG ATATTAAAAA GGCTACTAAA 1020 

GCTATTGAAA GTGTTAGTGG AGAGCAGATA TTAGGATCTA ; TTGTTGTGCT GCTACTAAAA 1080 

CCGTTAAAAG TGGTGGTGAG GAGCCAAAGG GGAAGAATGC iCKSATGAAGCT ACAAATCCGA 1140.. 

TTGAAGCTGC CATTGGAGGA AATGACGATT CGGATGCTAC TGCATTCAAG GGGAATATGG - 1200 
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r^ffrGCTATTG TTTTGAGAGG AATGGCTAAG iBfcC 



AAAAAGATAA TCAGATTGCT^CTGCTATTG TTTTGAGAGG AATGGCTAAG AACGGGGAAT 1260 

TTGCTGTGAA AATGGGTCGA AAACCAAGTG GTGATGGTGA TAATATTAGA GTTCTTGTTA 1320 

ATAATGCTGC TAATAAAACT GTTGATGCTT TATCTAAGTT AGCACTAGAA GCTATTAATG 1380 

AAAGCTTAAC AAAAATAGCC AAGACTATAC ATTGAAAAAA TAAAGTAAGA ATCAGCATTT 1440 

TTAATAAATA ATATTATTTA TTAAAAAATG CTGATTCTTA CTCAACATCT TACGTCAGTA 1500 

GTTTACTAAA CTGCATAATC ATTACATATA CACCAACATA TCTAAATTTG CAAACAATCA 1560 

TCTTAG 1566 
(2) INFORMATION FOR SEQ ID NO: 66: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1552 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 66: 

CTGTTTTGTA AACCAAAAGT GGATTATAAT AATTGGGCCT ACTAGCTTGA ATTCTAGAGT 60 

CAAGCAAACT TACACTAATT GTATCTTGCG GCAATTTTGT ATTCCTCCTT TAAAATTTCA 120 

ATTGCTTTTA CACTAGCATT AAATGCTATA GATGCACTGT ATGCATGGTT GCTATATTTT 180 

GTGCCTAAAT TAATAAGCCC AACTGTTTGC ATATTAGATA TTGGATAAAT GTAAAAGTTA 240 

ACTTTACTAA TATATTCGGG TTGGGATTGA CTTTCTAAAG TATACTTATG GGCTTTATTG 300 

TGTAGAAAAT TGCTAAGCAT ACCATAAAGC ATTAACATAC GTGAATTAGC GTCAAAATCT 360 

TGAGCGTTTA ACACTATAGC AATAATATAT ATTTGAAAAT TTAAACTGAA TTCCAAAGCA 420 

TTTTCATAAA ATGCACCGGC TCTAG7VATTA TGATCAAATA GATTTTCTGT ACCATCAAAT 480 

TTCAATGCTA TTATATTTGA GCTAGCAGCT GTGATTTTTG AAAGGTACGG GTGATTGTAA 540 

GTATTTATGA TATCGCACTC AAAATTATTT TCAGTTGCAT ACGCCTTAAA CCCTTTGAAT 600 

ATTTGAGTTA AATGGTTTAA AACCATATCT AAAGTAAAAA TCATTCAAGT GTTACCTTAT 660 

AAGTAATCTC GGATAACATT TTGGCTGTAT CAACAAGTGG AATTGCTGCG GTGTTACTAC 720 

^CCTTTTTAAA CTTACTTTTG ATTGTATTAG CCTTTAAGGC TGGAGAGACT TGTGCTGATA 780 

ATAGATAATT TCCATAGTAC CTTATAAAAG CTTGTCCAAT AGCCTCCATT CCCGATTTGG 840 

GGTCAAGATT AAACTTAGAA TTTATATAAC'v.TATTATTGAT ATATTCTCTA AATTCAGAAC 900 

TACCAGCAAT .TTTGGTTAAA TGTTTTCTTG CTGGTAAATT GCTACCCCCT TTTTCATGCA 9 60 

TTCTAGCAAT CCCTGCACGA CCACCAAACC ACCCAATTTC CAATTCCATT TTAAACTCTA 1020 
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GTTTGTCCAT ATAAACTCCT TTAAAACCAA AGTAAAATAT CCGATTGAAG AGTCAATACT 1080 

AAATATTTCA AAGTAAATTA AATCCGAAAT TGATATGCGG TCTTTTAGTT CATAGTTAAG 1140 

GTCTTGATAT GTGTAAAGTT TGGAATATCC TTGAATATCA GACATATCAG AGTCATAAAG 1200 

CACTGCAAGT TCTTGTGGCC TTATGTCAAT AATAACTCCT GCAAATTCAG TGTACTTATT 1260 

TTTATCAAAA ACTCTCTGAT AAGAAGAATC GTTTTCAAGT TTAACAACAG TGCCTTTATA 1320 

AAACCTTAAA GGTTGAGGAT CCTTAAATAC GTTGATCATG CGGAAAGACA TATCTGAAAG 1380 

TCTTTTTCTA ACACCATTCA TTAGACAACC CCCACACAAG ATGGCGTTGA AGTTTCTCTT 1440 

TTTAGTTTTT CTAAAAAgCa TCAAGTTGTG AACAAAAATT CyTGkTTGAG CCACAACCCC 1500 

CCTCGsCGGC TTCTTCGGCT CCACTGGCTA CTAGGnTAAT AATCAAGTTC CA 1552 
(2) INFORMATION FOR SEQ ID NO: 67: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1484 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
{D) TOPOLOGY: linear 



(xi) SEOUENCE DESCRIPTION: SEQ ID NO: 67: 

AGTCATTACC GGATTGTAGC TTACATATTC CGCTTTTCTA TCATAATAAT TGATAACTGG 60 

TCTTTTAGAA CAACTAGTAT TATAAGTGCG TGTTATGAGT TCATTTTTTG GTTTTATAAA 120 . 

AAACAATTGA GGAATATATC CAAAACCTTT TAGATCCATT CTAGGAAATA ACACTAAAAA 180 

ATTATCTGCT CCAAAAAGAG CAAATATTTG GGTTATTACA TCTCTTATTA TTCGAGTAAT 240 
TTC5C!r<?ATT .TCTTTCTTTT. CAATATCATT AATTTTTTCC TTGATTTTTT TCTTTTCAA.T..« . 3.00 

ATCATGATTG TTAGTAATTT TATTATTAAT ATCTATTTTG TTAGCTGCAT TGTTAGCAAT 360 

TTTTTTGTTA CTTGTCATAA GTAATTACCT TTTACCAAAA TTATGGAGTG TTGTTAGCAT 420 

TGTCTTGATT CTCAGCCTGT TCTTGCAGTT TTTTTAAAGc TTCGCCGCCA TCTCCGCCGA 480 

ACATTGTAGG TAGAACCGAT TTTAATTTGG CAAAGAAATA ATTAAGATTA AAAATACTTT 540 

TAATGCCATT AATTATGGGA TTGATAATAT CTTTGGTAAA ATCAAAATTT TTAATTTTAG 600 

CGGTGATCCA GTTAATGATA TTAAGTAATG GGTCCAAAAC AGTAGTGGTC AAATTTGAAA 660 

GAGTTTGCTC AGCTGAGGCG AAATTACTTT GAATACTCTC AGCATTATTG ACTTTTTTTG 720 

TAAGGCCGAA AGATTTAAAA* TCCTCGAACA TTTCCATCAT CTTGGTAATT CTGGAATCTA 78^. 

GATCTACCTC AGCCCCGCCT TGCCAAGCCC TTTTGGCATC TTCTATATAT TTGTCTCCAA 840 
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SS^TAAAAAGCT CACTTCCATC ACCCCCAAGaTSc;^ 



CACCTGACTT CTTTAATAGA^TAAAAAGCT CACTTCCATC ACCCCCAAGAtScACTATTAA 900 

CAGCCTTTAC TGCATCTTCG CTGCTCATAG CACCACTGGA TTTAAGCATA GCTGCAAATT 960 

CTAyGCGTTT TTCAAATTAG TTTCATTTAA CATATCTArG TCCCTTArAG TACCCTTAAA 1020 

GrCACTTGCT TGATTTAAGA ATTCTTCTTT TTCTAGGTCG CGCTCAAATC CCTTCATTCC 1080 

GCCAATAATC TTTAAAAGAC. TCTCTTTCTC TTTTGGATCA CCATAAAACG CTTTATTGAG 1140 

AAGTTGTGTT CTTTTTGTTT TGGTGTCTTC TTCAACCGAT TTTTTAGCAA AACCTAAAAG 1200 

GCCTCCTCCA ACTTTACTCA TAGCGTTGCT AATGATATTC CCTAGGGCAC TACCTATAGC 1260 

AATTTTGGCA ACAAGTCCTT TTCCTTGAGA GGCCGCTAAC ATTTTACTTT TTGCTTTTGA 1320 

TTCTTTTGCA AGTTCTTTAT ACTCAAGACG CCTTTTGTCT CTATCAGACA TTAAAGATCT 1380 

TCTGAAAGCC TCTTTTCTAG CTTTCTCAAA CCCCATGCCC TGTTTTATAA GTTTTTTAGT 1440 

TTGTGTAAGT CTATATTTCT CAACACGCTG GGTACCGAGC TCnA 1484 
(2) INFORMATION FOR SEQ ID NO: 68: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68: 

CTGCTTATTA ATTCCAATAA GTGCTTATAA GTGTTGTTTT TCTTAAAATT AGTTACCATT 60 

GGGAAAATCG GTATTTTCAA TTTTAATCTT TTTAGAGGAA ATTCTAATAA TTGCATGCTT 120 

TCTACCGACC ATTTTTGAGC AGTCATTGGA ATTATTATAT AATTACTTAC AACTAATACG 180 

TTTGTTAAAA TAATTCCCAA ACTAGGACTA GTATCTATTA TTATGTAGTC GTATTTATGT 240 

TTTAATAATT TTAAACTATC TTTTAATCTT. GTTTCTTTAA ACGGGATGTT ATCGTCATAA 300 

AAAAGGTATA AATATATATA ACTGGGCAAT ATGTATAAAT TATTGTTTAA TCTAAAGGTG 360 

GAAGAATTTA TGTTTTTTTT ATCTGCTAAT ACTTCGTAAA TGTTTTGTTT TGAAACATCT 420 

ACCCCTTGTT CTTCCAAGAG ATCTGAAAAA TAGCTAGTGG TTGATGCTTG TGGATCGGCG 480 

TCAATTAGAA GAACTTTATA. TTTTTTAGAC AAGAGTGTTG AAAAAATAAT AGCACTTGTG 540 

CTTTTGCCAA -GACCTCCTTT AATTGAGCAA ATGGCAACTA TTTTAGTGTT TTCTCTATCC 600 

ATTTATTTAT AATTCCTCCA TCAGGCAATT CTTTGCAATA AAATTCATAC ACTTTTTTTT 660 

CCAATCTGTT TAACATGTCA ATAAATGTTT GAAAATATTT TTTATTAATT TTTTCTTTTT 720 

TGATTAACCT AGCAAGACTT CTTAAATAAC AAAACACACT GCCTTTTTTA AATTTAAATT 780 
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CTATATAATA TACTTTGGAA' AATGTATATG ATTTTAAAGT GCCATTGATT TTGTATTTTA 840 

TAACAATGTT TTTTATAGGT TTTCTGTATC CATAGAAAAT TCCTATAAAT TTATCATTTT 900 

CTTTTGTAGA GAATAAATTA AGTCCTTCTA ATTTTCCTTG ATTAAATAAT TTTCTAAAAA 960 

GAATTAAAAA TTTGTTTTTT TTATATCTGT TTATTTCAAA TTTGTATAGA TCCATTAGCA 1020 

TTTTAGTGTG ATATATTGCT CTTTCGTTGA GAATTTCTTT TTTGATGAAA ATTTCTGGCT 1080 

TTCTACTTTT TTTTATTATT TCTTTTTTTT TGTTTTTAAG. TTTTTCTAGT ACACTTTTCA 1140 

TTTCAAACTC TTAATTTATA TAGCTATTTT TATAAATATT TTGTGATTCT ATTAGTTTGA 1200 

TAATTTCATT ATAGTATTGA TTATTAAATA TTTTTTTGTA TTCAAGTTTA TTTTGTTTGT 1260 

TTAAGTATTC TTTAATTTTC GACCTTAAAT TTGTTGTGTT GGTTTTTCTA TGTAATTGAT 1320 

CTAAAAGTAT GTTATATATA TTGGTTTCTA TATTGTCTTT ATGTTTTTGG GGTTCGGTTT 1380 

TATTAGTATC GTCCTTTATC TTTTTTATAA TTTGATCGAA ATCCGGGGAT CCTCTAGAGT 1440 

CGACCTGCAG GC 1452 



(2) INFORMATION FOR SEQ ID NO: 69: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1426 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69: 

CCCAGCCGGA AGGGCCGAGC GCAGAAGTGG TCCTGCAACt TTATCCGCCT CCATCCAGTC 60 

TATTA^lTTCT O^COGG .120 

TGTTGCCATT GCTACAGGCA TCGTGGTGTC ACGCTCGTCG TTTGGTATGG CTTCATTCAG 180 

CTCCGGTTCC CAACGATCAA GGCGAGTTAC ATGATCCCCC ATGTTGTGCA AAAAAGCGGT 240 

TAGCTCTTCG GTCCTCCGAT CGTTGTCAGA AGTAAGTTGG CCGCAGTGTT ATCACTCATG 300 

GTTATGGCAG CACTGCATAA TTCTCTTACT GTCATGCCAT CCGTAAGATG CTTTTCTGTG 360 

ACTGGTGA6T ACTCAACCAA GTCATTCTGA GAATAGTGTA TGCGGCGACC GAGTTGCTCT 420 

TGCCCGQCGT CAATACGGGA TAATACCGCG CCACATAGCA GAACTTTAAA AGTGCTCATC 480 

ATTGGAAAAC GTTCTTCGGG GCGAAAACTC TCAAGGATCT TACCGCTGTT GAGATCCAGT 540 

TCGATGTAAC CCACTCGTGC ACCCAACTGA TCTTCAGCAT CTTTTACTTT CACCAGCGTT 600 

TCTGGGTGAG CAAAAACAGG AAGGCAAAAT GCCGCAAAAA AGGGAATAAG GGCGACACGG 660 
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jt^Ptccttttt caatattatt gaagcattt^^^^ 



AAATGTTGAA TACTCATACT^TTCCTTTTT CAATATTATT GAAGCATTTAtCAGGGTTAT 720 

TGTCTCATGA GCGGATACAT ATTTGAATGT ATTTAGAAAA ATAAACAAAT AGGGGTTCCG 7 80 

CGCACATTTC CCCGAAAAGT GCCACCTGAC GTCTAAGAAA CCATTATTAT CATGACATTA 840 

ACCTATAAAA ATAGGCGTAT . CACGAGGCCC TTTCGTCTCG CGCGTTTCGG TGATGACGGT 900 

GAAAACCTCT GACACATGCA GCTCCCGGAG ACGGTCACAG CTTGTCTGTA AGCGGATGCC 960 

GGGAGCAGAC AAGCCCGTCA GGGCGCGTCA GCGGGTGTTG GCGGGTGTCG GGGCTGGCTT 1020 

AACTATGCGG CATCAGAGCA GATTGTACTG AGAGTGCACC ATATGCGGTG TGAAATACCG 1080 

CACAGATGCG TAAGGAGAAA ATACCGCATC AGGCGCCATT CGCCATTCAG GctGCGCAAC 1140 

TGTTGGGAAG GGCGATCGGT GCGGGCCTCT TCGCTATTAC GCCAGCTGGC GAAAGGGGGA 1200 

TGTGCTGCAA GGCGATTAAG TTGGGTAACG CCAGGGTTTT CCCAGTCACG ACGTTGTAAA 1260 

ACGACGGCCA GTGCCAAGCT TGCATGCCTG CAGGTCGACT CTAGAGGATC CCCaGAtGGG 1320 

GTTATTATTG TTACTGTTAA TGACTATCTT GCAGAACGTG ATTCCAATTG GATGAAAGCC 1380 

GGTTTTTGAA TCTTGTGGGG TGTTAGCGTn GGGGTTGTTC TAATCn 1426 
(2) INFORMATION FOR SEQ ID NO: 70: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1425 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70: 

TTTTGGTTGn AATTGCCACn ATAAAAGGGA TTCTTTTTTG GGTTTTATGG GCGGTATTCT 60 

TCATTAtAAA nTTmnTCtAT ACAGCAAATA TGGAAAGACT TGAGAGTGCA TTAACCCCAG 120 

CAATAAATGC GGCACTCGCT CCATTAAATG AAAAAATCAA TCAATGCATT GACTTAGTTA 180 

ATTCTGATGA AAAAAATCTC AAAATATCTA ATGATCTGAA ATTCAATCAG GAAGGAAAAC 240 

CTATCTATAA GGAAAGAAyA AATAATGCAA AATAACACTA TTGGTTTAGG ACTTAATTTA 300 

CTATCCAGCT TAACTAACAT AGCTAAAACT GATACAAACA TAGATCATAA TTACATTAAT 3 60 

ACTTTTAGTA AAGTAATAGA TTTTTTCTAC AAAACATATA TAAGCACACT AAAATCTATG 420 

GAAACAGCTG AGTCAACTAA AATATTTGAA GAAATACAAG ACATTTTAAA ATACAACATT. 480 

GAGATAATAG AGGCTATCTC TACTGATAAA AGCAAAAGAA TTATCACTTC ACTTAAAGCA 540 

ACACGTAACA AAATCATGAA AGAATATATC AAAATACTTA AAAGAGGTGA AAATGCTTAA 600 

AAGATTGcAT TGTCTACTAA TTGCTTTGCT GCTATGTTGC ACCACTATTG CTAACCTACC 660 
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AGAAGAGCCA AAACCGCCAA TTATTCAAAC ACTAAAATCT TTAGCTAAAT ATGAAACACA 720 

ACTTTCAGAG TATGTTATGT ACCTTGTAAC ATTTTTAGCT AAAACAAAAG TCAAAGTTAA 780 

TGACCCAAAT TATCCAGAAT ATCCTTATCC AGACTTATCA ACACTAAAAG ACGAACACTC 840 

CATAACTGCA GTAAAACACA ATATCAACAT ATATTTAGAG TACATTAAAA AAACAAAACC • 900 

AATAGCGGAA AAAGTCTATA ATAAATATTC CCAATTAAAA ATGTAAATTA CAAAAAGGTT 960 

TTTCTTGCAA GAAATTCTAC TTTATAATTA AATTGGCTTT TACAACAGAA GAAAATCTAG 1020 

ATATTAAATT TACTTTAATC TAATATCTAG ATTTTAACAT TTTCAACATG AATATTTACT 1080 

AATTAATTAG TGCCcTCTTC GAGGAACTTT ATTACTTTGT CTATCTGTTC TACAGCGTTT 1140 

TTAGACATTT TATCCCCATT ACCAGAAGTA TTGCTTcCAA GAAGTGGTAC AGTTACTCCA 1200 

ACTAATTTTG CTTCTGACCA TATTTTTCTT TTTGAAATAT CCTGATCCTT GTCAGTAATG 1260 

TTTTCAATGG TATTTTTAGC TGCTTTTAAC GCTGCTAATT TGGCCGCTAA TTTATCCTGA 1320 

AAGGAATTTT GCAAATTTAA, TAGTTTTTCT TTAAGCTCTG CATTGCCTAT ATCTTTTAAA 1380 

TTTTCTTTTA ATTCATTTAT TTTGTCTTTA TAATCTTTAA ATTTG 1425 
(2) INFORMATION FOR SEQ ID NO: 71: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 142 3 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71: 
CAGGTCGACT CTAGAGGATC CCCTAAAATA ATTAACCCTG .TCAATAAAGC GAGAGTGGAC . .. . 60 

ATTGATTGGA TGATCTATTA CAGAAACCCC ATTAATATAC ACCTTTTTAA ATACAATCTC 120 

TGTGTTATTT ATAACTTGTA TATTAAAACC TAAATCCATG TATCCGTCGT GATCATACCT 180 

CAAAGTAAAA GATCCAAATT TGGTTTTTAA TTTAAGAATT AAACCGAAAT CATATCTATT 240 

ACTATCATTT AAAATAACAA CTTCTTCAGA TATTTCACTA GGAAAAATAA ACCTGCTGGG 300 

AATTAATAAA AAAGAAATTA ACAATATTAT TACTTTCATA CCTTTTATTA TTATACTATT 360 

CTAAAGAAGA AATAAATAGA ATAAAAAATT TTAATTTCTC TTTTTTAAAA CTATTATTTC 420 

TAGGTCAAAG ATTATAGAAT AGAAATAGTT TATTGCTTTA TCTAATGATA GCAGCTTATA 480 

GGATCTTTTT TAAGATCGGT CTATCATCAA GAATATAAAT CACAAAAGCT TTTTAAAAGC 540 

TATCTA7UVTT CTTTATTCAA GGCAATAATT TATGTAAAAA TAATTAAAAA AACCTCCATT 600 
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:g^attgatttg gaaagtcaaa TGCACAATTC^BD^C 



TTTGAGCAAA CATTTATACG^RTTGATTTG GAAAGTCAAA TGCACAATTC^9[ACACTGAT 660 

TGATAAAAAT ACTTTTTAAG TTTTTTATAT TCAAAATATA AAAAACTTAT TTATAAAAGA 720 

TTTTTCAATA TCGATTTTTT TGTGATTTTA TTATTATTGG TATAAAATCA CATAGGGCCT 780 

AACCATAAAT ACTCTTAAAG CAAGAATACT TATCTTAAGC CCTATAAATA GACATCGACC 840 

AAAGTTAAGG ATGCTTATAG TTAATAGCAC CACTTACCAA GATTATACGC TATTATAGTG 900 

TTAAAATCAA TACATTATTC TCAAATAATA TACATATTTA TTTATAAATT ATCTTTTAAA 960 

AAATTTACTT CACTTTATTG ATTATTTTTC TAACACTTTC TGATTAAAGT CAATATTTTA 1020 

CAAAGTATTT AAATTCGGGT ATTTGATAAA AATAGTGAAT TTAAATACTT TATTTTCCAA 1080 

AAACTATAAT TTTATATTCT GCACACAAAA TTATCTATAT TAAATTTTTA ATTATATTTT 1140 

TTACACTCCT TATATTCTTT CATAATTTCA TTAAGCAATT CTTCTTTATC TTTAAGTAAT 1200 

TTTTCTAGCA AAAAACTAGT AAATCTTGCT TTTGATTTGT AATATATGTA TGCATCTTCT 1260 

GTTTTAAGCT GAAATCTTAA TGGCCTGATA AAATTTCGAT TGGATTTTTT AACTTTCCCC 1320 

CCTTCTTTAT CCTTTAAAAA AAATAAAGAA TTCTGTATAC CGTTTTCGAT TATGTATTTT 1380 

TCCTGAACTA ACCCTTCTTC TATTGCATTT GCCATTCTTA AAT 1423 
(2) INFORMATION FOR SEQ ID NO: 72:. 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1405 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear . 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72: 

TATTTATnAA TATTGAGAAT ATTATCTAAT AAAATATTAA AGATGTAAAA ATTAGTTACA 60 

AAAAATTGCT GTAGTGACAT AAATAATAAA ATTGAACTGC TAGAATTTTA TACAAAAAAT 120 

AACAAAAACT TTATAAAGTT GATAATTATA AAAAATTTTA AGATTTTCTT GAAAAGTTTA 180 

TCATATATAT AAAAAAAGAC AAGCACCATT ATTAATGTTT ATTAGTATAA AACCCCAAAA 240 

TAATACAAAT TTAATCCCAA CAATATAGAT AGGATCTTAT TTTTTAGATA AAGTTTTTTA" 300 

AAACTTTAAA AAATATATTA AAATTTATAA AATATAAAAA GCCTATAATA CCGCACTTTT 360 

ATTATCAAAA ATTGCTTATT TAATCTCATA AAAGCATCTT ATTGTTCTAT CAAGCTTATG 420 

TATTCTCTAT TATAAGAGCA CAATTAATTA TACCAATTGG GGAGAATATT TTTATGAAAA 480 

ACAAAATGAT TTTCTGTATC TGTGTTTTTT TACTTTTAAG CTGCTGTGCT GCAACCATGA 540 

CACTGAAACA AAAATTGTTG ATAAAACAAA AACCTAATAT ATTAATGAGA TAAAAATTTA 600 
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ATAGCAGCAA GTAAAGAAAT CATCGAGAAA CGAACACTGC AACAAACTGA GCCAACAGAT 660 

CAAGAACCTG TAGATAATAA AAACTGGGAG GAAGTTTTTG ATATAAATAA AAAAACTTAT 720 

GACTTTATAA ATAGTTTTTT AACAAATGCT GAGTTCAATA TATTTGCAAC AATATTAAAT 780 

AAACCAAAAC AATCACCAAG CAAGATGTTA AATAACATAG CAATTTTAGA GCTTAATCTG 840 

GAAGAGACAA TTAATTACTT AGACTCAAAA AAAGATGTCT TAGATAAGGT AAACfAcCTTA 900 

GATTTGGAAA AGATCAAAAA CTCTCTTGAA TAATTACTCT CTATAAGGAA TTTTTTTCAA 960 

TT^GCATAAG AAAAACTTTA TTAGATCATC AAAATAATAC CGGTTCTATA AAAAAGGATT 1020 

ATTCTAAATT AGATTCTTAT CTTAATACAA TACTTAATCA GTTTAATGAA AAAATTAAAG 1080 

AGGTTGGAAA TTTGAAAAAA ATTATATTAT CAATAACTGT TTCAGCATTA TAAATTAAAA 1140 

TTTATTAATG CAGGGGCTTA AAGTAAATTA AACCTTTAGA TATAAGGGGC. TAATAAACTT 1200 

TTTTATTAGC CCCTGTTAAC ATTCCTTTAA TCAAAAATAT TGAATTTTAA TTACAAAAAC 12 60 

AAAAAAACAA TTAGATTGTG AAAACAATAA AGATCTTATA TAAACAGATA TCAATGAGCT 1320 

TAAATCCTAT GTAAGTAAAC TTGCCGATGA TTTAAACAAC TATCTGCAGA AGCAAGAAAT 1380 

CTGCATTTAT AGTGTCAACA TATAG 1405 
(2) INFORMATION FOR SEQ ID NO: 73: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1398 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ JD NO: 73: 

CnTCAACTTC AGCTCTGTAG TACTATCTGC ACTAAAACTA AGCTTGACTC CACGCTTGTA 60 

TGGATACCCT TTAGCAGGAT AATTTTCTAT TTwATCTTTA CTACTAGTAA AAACTCCATC 120 

CGAATTGGAG TAAATTAGAT TTTTATCTCT AAAATCTACA GAATTACTAA GCAAACCAGC iSO 

ATCTTGCTGA GGATTTTTCA TTAATGCTTT AATTTCTGCA ACTTTTTTAT CAAAATCTTC 240 

TTTTATTTTT GTAATACCAT CGCTCATTAA AAACTCCTTT AAGCAATACT TGTTCTTTTA 300 

TGTCTTTTTA GATTCTCATA AAATTGAGCT CGTCTTTGCT TGTAAGTATT ACTTATCGCT 360 

TGTACAAACT CCGTGAAATT AATGGGCACA AAATTAGAAT CAAGCAAACT TGCTCTCTCT ? 420 

TCTGATTTAA CAACAATATT GCCTCTGACA GAGTCAACAG AAGAAGAATT GCTACTCCCA 48J3 

GTTTTTCTTA ATTTAATATT CACTTTTGCT AAAGAAACAA GTTGTTCTAG TATCTCTCCA 540 
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S^^GCTTTAGCA ATAGCTTTAA TTTGCTCAA'^tGG/ 



TCGATATGAC TTATATCTG^^GCTTTAGCA ATAGCTTTAA TTTGCTCAATTNGGAACAAAC 600 

TTACGAACAA GCTCTCTACG TTGTGCCTGC ATAATGTCTT TTAGGGTGTA TCCTTTTGCA 660 

AGTAACACTT CCTTGTTAAA ATGGTTGCTA AGATGCGCTT TTACAAGTGT ATCAATTTCA 720 

TTAATTCGCT CAGCCTCTAG TAACAATTGC TTTTCAACAC GCTCTCGATC TTCAACTTCT 780 

GCAAGTTCTT TTGTTATTCG CTCATTTATA CTCATCACGC CTTACCTCTT TAGGGGGTTT 840 

ACATTGTCTG TTTGCTCTTT AAAGCGCATG TACTCTTCAA ATTCCTGCGC ACTTATAACT 900 

TTAGTATCAG CCTTATTTTG CTGCTCTTCT TTATCTTGTG CTTGCAGGTC TTCTTTTTCT 960 

TTTTTCTCAG TCATCTTTTA ACTCCTTTTC TCAAAATGAG AATAATTTCT CTTTTAAAAT 1020 

CGCTAGCTCC TCATTATCAA AGGiciGCTACT TTGTATAAGC TGGTTATATT TACTGTAAAG 1080 

CTCAATTAGC TTTATATCTC TTTCCACTTT TTGCTCTTCA CTTAACATAA TCAGAGAATT 1140 

AAACTcATAT CAAGCCCGAA ATACTTgTAA GTTTCAAGTT ACAAGCGTTC TCAACTTGTT 1200 

CTTGcACACC CTTTT^AAAAA TCGTAATAAT TACTCCTATC CCCTTTACCA TCATTTCCTA 1260 

GCCCTTTAGC CTGTTCGTTA AAACTTCTGG TTAAGGGCTC TTtAGTATCT GCACCAATTT 1320 

TtGCCTtAAT TAATGCTAAA GCCTCCTTTA AGTAACTAAG GTCGTATTTA ATAACCTCTA 1380 

AACTAGCACT AGGGGTGG 1398 
(2) INFORMATION FOR SEQ ID NO: 74: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1380 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS ; double 

(D) . TOPOLOGY: linear 

(xi) SEQUniicE bESCRIPTION: SEQ ID NO:" 74 

ATAATAGGCC CAATAAAGAA TATTTTGAAC ATGAATAATT ATTTAATTAC CAATATAAAG 60 

CTAAATACAA AATAAATTCA ATATATCTTT AAATTCTAGA AAATTTTTAA TCTAAAAAAA 120 

TCATTATTAT A6TGCCCAAA ACAAAATAAA ACTTAAACTG GGAAAATTAG TGTTACATAA 180 

AATGAATAGG GCTTAAGACA AATTCTTTAT AAAAAACTTG CTTTAAGCCC TATTTCACGA 240 

TCATATTGTG ATTCGAATCC GCGTCGAACT ATTTATAGTA TAACAAAAAT TAAATCATAG 300 

TCAAGTTGTA TTTTAAATAA ATTTTAATCT TAATTACTAA AACTTTACAA TATAACTAAA 360 

ATTGCTATAA GAGTATTTAC TTTTATAGCA ATTTTAGTTA TATTGTAAAG TGATCAATTG 420 

TGAGGAGAAA CTTTTATGAA TTCAAAAACA ACAAATAAAA CCACTAGAAA TTGCTATAAT 480 

AAAGTTCAAC ACAAATTAAT AGTTCTTATT TCAACAATAT GCTATCTAAA CAAAACACAT 540 
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AAGAAATATA CACAAAAAAC CATACTCTAT TATTTTAATA AAAATCTAAG AAAAAACOGT 600 

CAACCTATTT CTACACTAAG AACTATGCAA AAGTATATTT ATAGACTACA AAAAGAAATA 660 

AAAGTCACAA AAAACTACTA ACTATTTCTG ATAACAATAT CGATATCCAA ACCATGTAAT 720 

AGAAATCCCA AACACATAGA GCCAGCCCCC CAAAATACAA GGAATTAAAA TCAAGCAACA 780 

CATAAACCAT TTCAATAACT TCTAAGTATA AAATGCCAAA GCATAAATTT TGCTATTGCT 840 

TAAACTATTT TCGAGTATAC ATCTGTATTA AATTTAAGCT TGTTTTTTCT ATCAATGAAA 900 

TCATCTTTTG CATCCTTGTC AAATACAATT TCACTTTAAT TTTAATAAAA AATAAAATAT 960 

TTGGACTCAC CAATAGGCTT CAGTGCCCGC ATTAAACCTA AATGTTTAAT TAAAAATTTT 1020 

TGGATTGTTA TTCCCAATGC TTTTTCTATC TTGAAAGAAC TTTAAAAGTG CTTTCAAGAT 1080 

AGTTTCTTTT TGCACGTTAC TTGAATTTAC ATTCAAATAA TAGGGCAAGT TGCTTTATAT 1140 

ATACTCTTTA TTTTTTTTGA TTTTTGTATT TAAGTGTTGA TATTATTAGT AATATTTTAA 1200 

ACTTTACTCT TAACTAAAAG CTTGTTTTAT TGTTAAAAAT AAAACACAAA CAATACCCTA 1260 

TAAATAGTTT AATATTGCAA TATTATTTAA ACTATAAAAA TATGTAAATA ATAATTTATA 1320 

AATTAATAAA AAACATATAA GGGAGCTTTC TTAATGAAAA TCAAAAATAT AGCAACATAT 1380 



(2) INFORMATION FOR SEQ ID NO : 75: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 132 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



. . (xi.) SEQUEaaCE DESCRIPTION :_. SEQ ID NO: 75: 

TnAGAGCAnG GATCCAGGAG AAGTTAAAGA TCCTATAATG TATAAATGGT TTTCGCCTGA 60 

TCAAATTGAA GATGTTGATC TTCAGATGGG CTACCAAAGA ACTGTAAAGT GGGATGCGTT 120 

TTTAAATGCT AATCCTACAA CGATTGCTAA TGAGGTTAAT ACTATTTCAA CTATTGGATT 180 

TAGTTCTGAA GTGGTAAGAC TTAATTACTT AAAATTACAG TACAAATTTA GGCACTTAAA 240 

GCAGGCGTCT GAAAAATTTT ACACTTCAGA CTCATATCTT GGTGACATTA ATAACAATTT 300 

ACTTCCTTTC TCTCAAGCCT ATAAGCTTGC AAGTAGCGAG ATTATTAAAC TTATTAATCA 360 

CTTTGTACTA ACAGGCACTG TTTC/^TTCA AAAAGATGGA AAAAATCAAA AACGTCTACT 420 

TCCCAATATG TATGGACTTC TTAATATGCC ACATCAAGTA AAAGAAGAAG TTGCTAGTGG. 48il. 

TGATAAAGAT AAAATGGATA AAATATTTGA AT^AAATTGAG GCGGGACTTT CAAAGTTAGA 540 
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'^^KCCTATGAT GGTAATAGTT GACCCTACAA^^TCGCl 



GCTAGGAGAC GAATTTTCTA^ACCTATGAT GGTAATAGTT GACCCTACAA CTTCGCTCAA 600 

ACTCGTAAAG CCATACGCAG CAGCACAGGG TGCAGCAAGT AGCTGCGAAA AATGGGAGGA 660 

TGTTTTGATT CAAACTATCA AGGCTATTAA TAATAGAGAA GATGTCTACA TTGAAACTTC 720 

AAACTTGCTA AAACATCAAA TACTTATTTA CCCATTAAAC CCAGAGCTTA TTAAGTTTAA 780 

ACCTAGCAaG TATATGTTAC CTACACCAAA TGaACAAGTG GATAAAGATT CAACTGATAT 840 

-TGcTCATTCA TACATTGATT TTGTTTTAGG AGGGTTACTT GCTACTJiGAA AAACTATTTT 900 

GCAAGTACAT ATCAAACAAA GTTAAAAGTA TAAGGTAAGT GAAAATGAGT GAACAAGAAA 960 

ACTTACAAAC ACAAGTTGAG GCTGAAGAAG AACTTTTGGT AACAAAACTT TATTCTGAAG » 1020 

TGTTATTGTT ACTAGGAATA GACAAACTTG CATTAAGCAG ACAAAATTTT CTACTTCATT 1080 

TATCTTTACT TCAAGCTATT CTAGTAACAC GTGGTATTGA TGCTAGTTCA CTTACATATG 1140 

AACAAATATT TTTACTTACC TTTTACCATA TGGGTTGTCA ATTAAGAAAA CAGGGAGTTG 1200 

TTCGAGAATT TGAATTTGAT AGGATCAAAA AAGAGAAATT CAATGAACTT GAACTTGATT 1260 

ATtATCCTAG TAGCAGTGGA GGCGAAGAAG GTGGCGAGGG GGGTTGTGGC TCAAACAAGA 1320 

ATTTTT 1326 
(2) INFORMATION FOR SEQ ID NO: 76: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1309 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear' 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76: 

GGGCTGCTAG ATTAATTGCA GGTAGCAGTT GCTTGATCTG CAAAATTATC TATATTGCCG 60 

CCGCTAAAAA ACCCTTGAAC GGTAGTTTTG AAGGTGTTTT TTCCTTCATC ATTTCCATTA 120 

CATTTATCAA GTTCAGTCTT TATATGTTCA AGTGCTGATT TAATTTTGCC TTCATCATTT 180 

TCTAAGAATT TATCAAATTT TCCAACACCA GTTAAAGCGG TTTTTAACCA GTCAAGTTGT 240 

GTTTTTT6AT CATCAGATAG CTTTTCTCTA AGCAGGTCTT CTTTAGATTT AGATTTAGGT 300 

TTTTCTTGTG TTGCTTCTTT TTGGGTTAAA TCACGCTTTT GTCTGCTTTT TGTCTGCTTG 360 

GTATTTGTAT CATTAGAATT ACAGCCGTTT AGCATTAGTA AAAACAAACA AAATAATATG 420 

TTGATAATTT TCATTGTTAC TCCTTTTTTT ATT^TTAATA TTCACTTAAC TAAGTATTAA 480 

TACTAAATAT GGGATAAACA ATTATTATTT GAATTGATAT GTTTTAAGTG AGGTAGTAGC 540 

TATTTAGAAA TGAAAGCAAA TATTAGCCCG GCTATCATTG TGATAGACAT TGCTCCCATG 600 
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ATTCCTAATA CCCATTTAAG CATTTCTGAA AGAGACATTA AATTCTTTTC AACATTGTCT * 660 

ATTTTAGTGT TTAAATTCTT TTCTACAGTA TCTATTTTGG CATTTAAATT CTTTTCCACA 720 

TTGTCAATCT TAGTATTAAG TTCGCTTTTA ATAGCATCAA TCTTAACATG TAAATTCTTC 780 

TCTACGGCAT CAATCTTGAT GTCTAAATTA GATATAyCCT TTTGTAAATt CTTTTCTACA 840 

GTATCTATCT TAGTATCTAA ACTATCTATT TTTAGATTTA AATTCTTTTC CACATTGTCA .900 

ATCTTAGTAT TAAGTTCGCT TTTGACACTA TCTATTTTAG AAATAAGATT ATCAAATTTT 960 

ATATCaAATT GTTTTTCTAA ATTTTCTAAA TCTCTATATG TTAGCTCATT GTGATAATAT 1020 

CTTTTAGATA AATCTTGTGC TATTAGTTGT TCCATGCCCA GCCTAATAAA TTCTTTATAT 1080 

ATTTGTTCTT GAGTTACACT TGCAATATTT GTTGACACTG TTTCCATAAA ATTTTCCCTT 1140 

ATGGTCATAT TATACACTAT TTTAGATTGA TTGGCTTTAG AGATTTTTAT ATGTAAAGGA 1200. 

GAATfTCTTG CAAGAAAAAC CTTTTTGTAA TTTACATTTT TAACTGGGAA TATTTATTAT 1260 

AGACTTTTTC CGCTATTGGT TTTGTTTTTT TAATGTACTC TAAATACTG 1309 
(2) INFORMATION FOR SEQ ID NO: 77: 

(i) SEQUENCE fcHARACTERISTICS : 

(A) LENGTH: 1300 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77: 

TATCTATATC ACCATTTTTA AAGAATTCTG TAACCACAGT TTTGAAAGTG GTTTTTTGTT 60 

GTTCTGCTTG, ATCACCATTA CAACTATCAA GTTGAGTTTT TATATGATCA AGTGCTGATT , 120 . 

TTATTTTATC ATCATCATTT TCTAAGAATT TGTCAAATTC TCCAGCACCA GTTAAAGCGG 180 

GTTTTAACCA GTCAAGATGT GTTTTTTGAT CGTCAGATAG CTTTTCTCTA AGTAGTTCTT 240 

CTTTAGATTT TGGTTTTTCT TGTGTTGTTT CTTTTTGGGT TAAATCACGC TTTCCCCGTC 300 

TTTTTGTTTG TTGGGCATTG TTTTTTAAAG TGTCATTATC ATTAGAATTA CAGCCGTTTA 360 

GCATTAGTAA AAATAAACAA AATAATATGT TGATGATTTT CATTGTTACT CCTTTTTTTA 420 

TTATTAATAT TCACTTAACT AAGTATTAAT ACTAAATATT GGATAAACAA TTATtATTtG 480 

AATTGATATT CTTTAAGTGA GGTAGTAGCT ATTTAGAAAw rAAAGCAAAT ATTAGCCCGG 540 

CTATCATTGT GATAGACATT GCCCbcATAA TTCCCAATAC CCATTTAAGC ATTTCTGAAA SOX) 

GAGACATTAA ATTCTTTTCA ACATTGTCTA TTTTGGCATT TAAATTCTTT TCTACAGTAT 660 
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CTATTTTGGC ATTTAAATTC^TCTCTACAT TATCAATCTT AGTATCTAA/^FTAGATATAT 720 

CTTTTTGTAA ATTCTTCTCT ACATTATCAA TCTTAGTATC TAAATTAGAT ATATCTTTTT 780 

GTAAATTCTT CTCTACATTA TCAATCTTAG TATCTAAATT AGATATATCT TTTTGTAAAT 840 

TCTTTTCTAC ATTATCTATC TTGGTATTAA GTTCACTTTT AACAGCATCA ATCTTAACAT 900 

TTAAATTCTT TTCTACAGTA TCTATTTTAG AAACAAGATT ATCAAATTTT ATATCAAATT 960 

GTTTTTCTAA ATTTTCTAAA TCTCTATATG TTAGTTCATT GTGATAATAT CTTTTAgATA 1020 

AATCTTCTGC TATTAATTGT TCCATGCCCA GTCTAATAAA TTCTTTATAT ATTTGTTCTT 1080 

GAGTTACACT TGCAATATTT GTTGACACTG TTTCCATAAA ATTTTCCCTT ATGGTCATAT 1140 

TATATACTAT TTTAGATTAA TTGGCTTtAG AGATTTTTAT ATGTAAAGTA rAATTTCTTG 1200 

CAAGAAAAAC CTTTTTGTAA TTTACATTTT TAACTTCAGA TATCAGTTTT AAATTTTTTA 1260 

CTGTAgATTT TTTACAAAAA CAGTATTGCA AAAACTCTnA 1300 

(2) INFORMATION FOR SEQ ID NO: 78: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1295 base pairs 
*(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78: 

GAATTAATAA GCAGAGATGA TAATTTTTTA GGCGTTATTC ATGAACGTGA AGACTTGAAC 60 

AAAAGGATAG CAGAAAACGA TACTTtCGAT TTAAATAAAG ATTaTATAAA AGAATATGaA 120 

ATTACACTTG aAAAATTTTT TCAGTTGTCA AATU^AATTTT TAATTTCATA ATATATAGGG 180 

AAATGAAATG AGTGTAAAAT TAAAACATAT GAATATAAAA ATAAAAGATc GTATTAATAC 240 

TGGcAAAAAT CAAAAGCAAA TTGaAATTAA TTGTGATGAA GaTAAAATGG AACGATTTCT 300 

ATTTTTAAAA GAAAGGCTAA TAATCAACTT CCAAAAAGAA ATTCACAATA AAATAGAAAC 360 

AATGAAGATC TTAAAAGAGA TTAAAGATAA AGAATATTAT AAATTAGATG GCTATCAAAA 420 

CTTTGAAATG TTTACTAGGA ATTACAAAAT AGCAAAAAGC CAGGCTTATG AATATTTAAG 480 

AATrGCAAAT GCAATAGAAG AAGGryTAGy TyrGGArAAA krCATAATCG AAAACGGTAT 540 

AyAGAATTCT TTATTTTTTT TAAAGGATAA AGAAGGGGrG AAgTTAAAAA ATCCAATCGA 600 

AATTTTATCA GdpCATTAAG ATTTCAGCTT AAAACAGAAG ATGCATACAT ATATTACAAA 660 

TCAAAAkCAA GATTTACTAG TTTTTTGCTA GAAAAATTAC TTAAAGATAA AGAAGAATTG 720 

CTTAATGAAA TTATGAAAGA ATATAAGGAG TGTAAAAAAT ATAATTAAAA ATTTAGTATA 780 
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GATAATTTTG TGTTAAGAAT ATTAACCTAT GTGATTTATC AAATATATTA TTTAGATAAG 840 

GTATTTGATA AAAAACAGGG AATTTCTTTG TTTATAAAGT AGTTATTTAA ATCATAAAAT 900 

GTCAAAAAAA TCGGGGTAGT AAAGT/^AAAA GTAAAAGATG ATTTACAAAT AAATATGCAT 960 

ATTATTTGAG AATAATGTAT TGATTTTAAC ACCAACAAAA TTCATTTTCC AAATGATATA 10i20 

AAAGTTTTTA TAAATGAGCT TATAGGGTCG TTTTCAAAAT TAGGCTATTA . TAAAGAGGCA 108.0 

AAAGAAACTT TGCAAAATAT TTTTTGTATA TTAGATAGTA ATTAAAAATG ATTTAGTCTA 1140 

CTCAATAATT TATATGAGAT AATAAAGTAT ATTAAGGATA TGTGCTTTAT TAATAAAAAT 1200 

AAAAATAAAA ATAAAAATAA AAATAATTAT ATCTTAATAA AAAAATTGGA AATACCGCAA 1260 

TTATTGATAA TTTATCGAAT TTAGATAGTA ATATA 1295 

(2) INFORMATION FOR SEQ ID NO: 79: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1284 base pairs 

(B) TYPE: nucleic acid . 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 




(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79: 

TATCnTTTTT CCTCAAAAGT TTAATTGGAA AATAAAAAGT TATnCTCTGG TGATATTAAT 60 

AATTTTATTA TTGGGAATTC ACAACGCTCA GTTGAAGTTA ATGTTTTGGG ACAATTTGAA 120 

AAGCTATGTA AACTTCTTAA AATTCCTTAT ATCCCAAGAC ATACAAATAA yTCATATATA 180 

TTAATTGATT CACTtCGTAT TAATCTATAT GGAGGAGATA AGGCAAGTGA TTTTGAAAGA 240 

TTTAGAGGCA. GTAATTCGGC .ACTTAOTTJT GTTil^ CTACTACTTT ACACAAGCAA 300. 

ACTTTAGAGG AGGTCTTAAA AAGACTTAGG TGCGGACAAG AAACTATTAT TTTTGATACT 360 

AATCCTGATC 'ATCCAGAACA CTATTTTAAA ACCGATTATA TTGATAATAT AGCGACATTT 420 

AAGAC ATATA ATTTTACAAC TTATGATAAT GTGCTACTTA GTAAAGGATT TATCGAAACA 480 

CAAGAAAAAC TCTATAAAGA TATACCATCA TATAAaGCAA GAGTTTTGCT AGGTGAGTGG 540 

ATAGCAAGCA CCGATTCAAT TTTTACACAA ATAAATATTA CTAATGATTA TGTATTTACT 600 

AGCCCGATAG CATATTTAGA' CCCAGCATTT AGTGTTGGmG GGGATAACAC TGCATTATGT 660 

GTTATGGAGC GrGTTGATGA TAAGTATTAT GCTTTTGTAT TTCAAGACCA ACGACCAGCC 720 

AATiGACCCGT ATATTATGAA TATGGTTAAG ACCGTTTTAG AAAATTTTAA TGTACATACA 78X) 

yTTTATTTAG AAGATAGAGA CAATACAAAA GGTGCTGGTG GATTGACyCG yGAATACATs 840 
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d^TCAATATTTT AGAATTGTTC CAGTTAAGCC^IKaG 



TTGCTAAGAA ATAATATGGG AATATTTT AGAATTGTTC CAGTTAAGCC AAAGTCTAAT 900 

AAATTTAGCA GAATAACArC GTTAATTACG CCGTTTAyTT ATAAGAAACT kTACATTACr 960 

AAGTACAGCA GTTCTTCTGT ATTTAATGAT ATTTATTCGT ATAAAGGAGA TAACAAAACC 1020 

•CATGATGATG CTCTTGATGC AATATCTGCA GCATATTTGA TGTTGTCTTT AGGGTATAGA 1080 

GAGAGAAGTG TTCACTTTGG CAATCAAAGA TTTTTGTAAA TTTTATTGAC AAAAATAATA 1140 

GTTTTTGCTA TCATACATCT AATTTAATAA AGAGAAATAA AAGGTGTGTG ATTTAAGAAA 1200 

AACAAAATTA ATAGATAAGA TAAGTTCACT AGAACTATAT AAATACTCAA TATTTTTTAG 1260 

GAATTATATA GAAAATGTAG CAGA 12 84 

(2) INFORMATION FOR SEQ ID NO: 80: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1271 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80; 

GCTTGAAAAA TTTCTTTCGG GGCGCTTAAT GGAAGAATCA TTTCTTATTA GAATGTGGTT 60 

AACTATTTTA AATTTTTTTC AGAAAGAATA AAAGCAAAGA AGAATATATA TAAAGCTTAT 120 

GTTATAAAAA ACCTGGAAAA TCAAATTAAT GAAATGTTGT AAAAATCCAG TAATAGATTT 180 

TAAGAAGAGA ATGTTTGCAT GTTGGTTTTG TGGAAATGTT TTTTAGTGTT TGCCGATATT 240 

CAATGGAATT GAAAGAATTT TTTAGGAAAT TAGAAAAAGG TGGTATTGTT GTTGAGCAAA 300 

CTATTTTA6A AATTATTCAA AGCAAAGTTC TTAACTCTAA GAACAATTTG GAAGAATTTT 3 60 

TTAGATGAAG GTGAATATGA GCTTTTTTTA AAAAAAGAAA AAACCCAAAA CGAATTTAGA 420 

AGAATCTCTT AAGGGTCAAG ATAAATGAAT ATATTAATTC TATTCCATCT AGTACTTACA 480 

AAATCGTCTC GGATATGTTT GAGTTTTATT ATGTTTTTAA TAGTTTGGCG TTTTTCCCTT 540 

ACAAATCTTT TTTTTCATTT TTTAATGTAG ACCTTTTAGA TAGTGCTGAG AATATTAGCA 600 

TTGTTGACTT TGAAGGTTGG ATTTGGGGGG AATCCTCTAG AAGTCGACCT GCAGGCATGC 660 

AAGCTTGGCA CTGGCCGTCG TTTTACAACG TCGTGACTGG GAAAACCCTG GGCGTTACCC 720 

AACTTAATCG CCTTGCAGCA CATCCCCCTT TCGCCAGCTG GCGTAATAGC GAAGAGGCCC 780 

GCACCGATCG CCCTTCCCAA CAGTTGCGCA GCCTGAATGG CGAATGGCGC CTGATGCGGT 840 

ATTTTCTCCT TACGCATCTG TGCGGTATTT CACACCGCAT ATGGTGCACT CTCAGTACAA 900 

TCTGCTCTGA TGCCGCATAG TTAAGCCAGC CCCGACACCC GCCAACACCC GCTGACGCGC 960 
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CCTGACGGGC TTGTCTGCTC CCGGCATCCG CTTACAGACA AGCTGTGACC GTCTCCGGGA 



1020 



GCTGCATGTG TCAGAGGTTT TCACCGTCAT CACCGAAACG CGCGAGACGA AAGGGCCTCG 



1080 



TGATACGCCT ATTTTTATAG GTTAATGTCA TGATAATAAT GGTTTCTTAG ACGTCAGGTG 



1140 



GCACTTTTCG GGGAAATGTG CGCGGAACCC CTATTTGTTT ATTTTTCTAA ATACATTCAA 



1200 



ATATGTATCC GCTCATGAGA CAATAACCCT GATAAATGCT TCAATAATAT TGAAAAAGGA 



1260 



AGAATATGAA T 



1271 



(2) INFORMATION FOR SEQ ID NO: 81: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1269 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81: 

GAATTTTTCA AAATTACAAA ACTTTAACCC AAAATGGTAA AACTTTAATT TTTTGTAATT 60 

TTTACATAAA AGTGTTAACT TTAAAATyCC AAACTTTATA ATTTTGGAAA ATTATCAATA 120 

CTTTTTTAAT TTATTCTTTA TTTTCAAAAT AATCTTTATA TACTTATATA TTATGTATAA 180 

GTCTGTAAAA GAACAACAAG AAAAAGGAAT AGATCATACA TGCAGAATAC TTATTCTTAC 240 

CGAAACAATA TTTGAAATAA ATTTAATATT AGAAAATTAT TCTCAAAAAA CTCTACTCAA 300 

AAAGTATAAC GAAAATCTCA AAAACAAAAA TCTACCTCCT AGTAATATAT CAACAATGAA 360 

AAAATACTTA AATCAATTAG AAAAAGAAAT. AAAAATCATA GCAAAATTCT ATTTTAAAAA 420 
CGATCAATCT CT/UVTTTATT^ ATyUVACTTAA TTATACCCTA GAAAAAATT.T .GGTTAAAACT , . ,480 

AATAGAATTA TTCTACAAAG AATTAAAACA ATTTATACAA AAGAACACTA CTACTTAATT 540 

GTAAATACAT TATAAAATAA TCTTATTCAA AACTTTAGAA ATATATTGTT TTACGCTAAA 600 

AAAATTTAAA AAATACTGTG CCATATTTGT AATATAAATT TAATATAATA GGGGGCTAAT 660 

TCATTATGGA . TGGAGTAaTT AACGATACAT TGGTCGCAAG AATGAAAAAG CAAATTAAAT 720 

TTAATAAGAA TAAGTTAATC ATTCTTGTCA AAACACTAGA TCATATGAAT AAAGAATTAC 780 

TTTATAGTGC AAATAAAACT TACAATTATG TCTTAATACA AAACAATTTT AATGAGGCTC 840 

TAGCTAAAAC TTATCAACTT AGGGTTAATT ATAAAACCCT ATTAGAATAT CTTGAAATAT 900 

TAGAAAAAAA TCCAAAAGTA ATCTTAAAAC GTCCCACAAA TAAAGAAAAT GAAAGCTTTA 96X) 

TAGGCCTTTA TACACTCCTT TACCCTTTAG AAGATTGTTG CACTAAAATT TATAATTCTC 1020 
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ATCCTAATAT TTAAGCTAAT 



1080 



TAGAGTATTA AAGGCCTAAT AAAGAACAAT TAAAACTAAA AAATATATAA ATAAACCGTA 



1140 



AATTAGGAAA ATTAATGTTA CACCAAATGA ATAGGGCTTA AAACAATTTC CTTTAAAGAA 



1200 



ATTTCTCTAA GCCCTACTTC ATTGCTTATT ATTAC6TCAA TTCGAGCATA AAGCCGAACT 1260 



(2) INFORMATION FOR SEQ ID NO: 82: ' 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1225 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82: 

CGGCCTTTTT TGTTGCAGCA TGATCAAGAA TCCCTTTAAA TTTAATGGTG AATTTGTCGC 60 

TCACTAAGCC CTCACTTGCT TAAAATTAAT TCATACAATT CTTTTTCTAA TTTAATCTCA 120 

GCAAGTCTAT TGACCTCTAA AgCTCGTCAT AAGGCAATTT CTTTACATTG TCGTACGAGC 180 

AAaTATTCAT AATTACTGGA AAATAATATT TGTCGTTCTT AATCTCGTCA. ^GCAgTTAAA 240 

ATATTTTTTT CTAGTCTCAT TAaGACTTGC AATAGCTTTA TCAATATCTC TATCTCTTTT 300 

GCTCATTTAG CAACCAGCTC ATTGGAATTT GATGTACTTG ATGAAAGTGA AGTGGCTACT 360 

TTTTCATAAT CAAAATTTTC ATTAATATAG TCAAAAGCAA CAAAATCACC AACATTATTT 420 

TCATACTCAC TCAAATATAC TAAAGCGGGC TTTTTTAGAT CATTGTCTAA ATGAAAAGTA 480 

TTAAATTGTG CAGTGTAAAT TATTGCAACA AGATAGTCCT TATAATAAGA AATAAATTCT 540 

CTATTTTGAT CCAAAATCAC ATAGAATTCG TCTAAAAATT TTGGACTTAT CATTAAGCTT 600 

GTGATTTCTC TTAAGTATTT AACCTCATTA AGCTTTAAAA CAGCGTCACT TTGATTAAAT 660 

CCTAGCACCT TTATCCCATT CATAGACTGG TAATACTTTT AGTGGATATT CATAAGTTTT 720 

ATTTTTAGTT AAAATTTTCA TTTTATATCT CATTATCATA ATAAGACTCT CCTTTTAAGT 780 

GTTGTTTGGT TTAGTTTTTT GGCAATTAAT AGCCCTAATT TCAAAACSATA CTTTTTCGGC 840 

CTCAGCAGAA TAACTTCTTG AAGGCTCTTC AGTAAAAATT GCATAGTTAG AAATAATTTT 900 

GGTAGCAATT CTATCATTGA ATACTAAATC AAGCATTTTA TCCTCTTTTC TCACATCCAT 960 

GTTGTAAAAC TGTTCATCAG^ AAAGTTCAGT TAACAAAATG TAGTCATGAC TACCTAGTGT 1020 

CACTTCAATG TTGAAAACAT AAGTTATTGT TTTGGGATCT CTTAAGCTTA TTACAGGCAT 1080 

ACCTTTATCT TCACTACTAA TCACTGCTCT TGTTGTAGGT TCGCTTGTAA GCTCTAGCTT 1140 



AATTTATAG 



1269 
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GCCACTATGT AACTGCGGTA CCACCAATTG AAAAATAAAC TTCTCTTAAA TCATAAAATT 



1200 



GCATTTTTAG AGCCCCTTTT TAGCA 



1225 



(2) INFORMATION FOR SEQ ID NO: 83: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1200 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83: 

CGGCTGGTGC TGTTAGTGCT GTTAGTGGGG AGCAGATATT AAGTGCGATT GTTAAGGCTG 60 

CTGGTGCGGC TGCTGGTGAT CAGGAGGGmA AGAAGCCTGG GGATGCTAAA AATCCGATTG 120 

CTGCTGCTAT TGGGAAGGGT GATGCGGAGA ATGGTGCGGA GTTTAATCAT GATGGGATGA 180 

AGAAGGATGA TCAGATTGCT GCTGCTATTG CTTTGAGGGG GATGGCTAAG GATGGAAAGT 240 

TTGCTGTGAA GAGTGGTGGT GGTGAGAAAG GGAAGGCTGA GGGGGCTATT AAGGGAGCTG 300 

CTGAGTTGTT GGATAAGCTG GTAAAAGCTG TAAAGACAGC TGAGGGGGCT TCAAGTGGTA 360 

CTGATGCAAT TGGAGAAGTT GTGGCTAATG CTGGTGCTGC AAAGGTTGCT GATAAGGCGA 420 

GTGTGACGGG GATTGCTAAG GGGATAAAGG AGATTGTTGA AGCTGCTGGG GGGAGTGAAA 480 

AGCTGAAAGT TGCTGCTGCT ACAGGGGAGA GTAATAAAGG GGCAGGGAAG TTGTTTGGGA 540 

AGGCTGGTGC TGGTGCTAAT GCTGGGGACA GTGAGGCTGC TAGCAAGGCG GCTGGTGCTG 600 

TTAGTGCTGT TAGTGGGGAG CAGATATTAA GTGCGATTGT TAAGGCTGCT GATGCGGCTG 660 

ATCAGGAGGG AAAGAAGCCT GGGGATGCTA CAAATCCGAT TGCTGCTGCT ATTGGGAAGG 720 

GTAATGAGGA GAATGGTGCG GAGTTTAAGG ATGAGATGAA GAAGGATGAT CAGATTGCTG 780 

CTGCTATTGC TTTGAGGGGG ATGGCTAAGG ATGGAAAGTT TGCTGTGAAG GATGGTGGTG 840 

AGAAAGGGAA GGCTGAGGGG GCTATTAAGG GAGCTGCTGA GTTGTTGGAT AAGCTGGTAA 900 

AAGCTGTAAA GACAGCTGAG GGGGCTTCAA GTGGTACTGA TGCAATTGGA GAAGTTGTGG 960 

ATAATGCTGC GAAGGCTGCT GATAAGGCGA GTGTGACGGG GATTGCTAAG GGGATAAAGG 1020 

AGATTGTTGA AGCTGCTGGG GGGAGTGAAA AGCTGAAAGT TGCTGCTGCT ACAGGGGAGA 1080 

ATAATAAAGA GGCAGGGAAG TTGTTTGGGA AGGCTGGTGC TGATGCTAAT GGGGACAGTG 1140 

AGGCTGCTAG CAAGGCGGCT GGTGCTGTTA GTGCTGTTAG TGGGGAGCAG ATATTAAGTG 12Qfl 
(2) INFORMATION FOR SEQ ID NO: 84: 
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(i) SEQUENCE CI 




ITERISTICS : 



1067 



(A) LENGTH: 1182 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doiible 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 84: 

GCTACAGAAA TAAAATTTTT AACAACAATT ATTTTTATTA TTTCGGCCTT TTTTCTCAAA 60 

TTTTTATTGT CCCAAAAAGG TAACAATAAA ACGAATAACC TAGAAGAGGT GGCCAATTTG 120 

TTATTTAAAA ACTTTAAAAT TTTTTGCAAT GCATTTTAAA TTCCAAATTA CTTTTGCATA 180 

AATAAATAAA CTTCTCTTTG CGCAAATGGA AATCCAAACC GATCACTAAA ATATTTCTTA 240 

AAAAATTATA TTCAGCTAGC CCAGATATCA TTTGCTTTTC ACACTGAAAA GCATCCTCTT 300 

GAACACTAGA ATTAAAAACA CACTGTTTTT AAAATTTTCA ATTTAAATTA AAGATTGTAT 360 

TTTGGCAAAA AATTTTCTAT ATCTATTTTA TATTCTCTiGT CTTCATTAGA AATTAACATA 420 

ATCTTTAATC GTTTTAATTT TTTGATTTTC TTAAAAAACC CTTTAGAAAT AGTAACACAC 480 

AAGGTATTTT TTACTACAAA AGGAAATTCT AAATGAAAAA ACTTTTCATT TATATTCGGA 540 

TCACCAATGT TAAAATCTTT TAATTGCTGC CATTTCTCAC TTGGTAAATT ATTTTCATGC 600 

TTTGAAACTT TAGCATCTTC AAATCCTTCA AAAATTACAC TTTTAAAACC TAAAATTTTA 660 

TTGTCATGCA CTTTAAAATC AAACCTATAA ACGGTAGATA ACGCTTTATA AGCATCTGCA 720 

CGATAACCTG TCGCTTTTAT CATCTTTTTA TGCTTAAGCT CAGGAATTAT AAGCTGTGAT 780 

TTTATAAAAA CCAATTCTTT CAAATTACTA TCTTTAAAAA GATATGTATA GGTTTCATCA ' 840 

ACAAAAACAT TATCATCAAA CTTTTCAACA ATTTTATTAT AAATAACATT GTTTTCTTTT 900 

TGTTTGTAAA AAAAGAAACC TAAAAAAATA CAAATTAATA GTAACCCAAA AAATAATATT 960 

TTACCCATTA ATAATCTATC CTACTTATGA AAAATCATAT CAAATGCACT ATAAAAATGT 1020 

GAGCTATTTT CCCTGCTTAC CCTGAAAGAA TATTTTTTTT CTCATTATTT ATCTCATCAA' 1080 

AACATTCAAC ATATACATCA ATTCCATTTT CTTCTGGCGA ACTTTCTTAT TTTATTCCAT 1140 

TTTTTCACTG GAAATCCAAG GAAACTCATA TCCAAAATTT AA 1182 
(2) INFORMATION FOR SEQ ID NO: 85: 

( i ) SEQUENCE CHARACTERI STICS : 

(A) LENGTH: 1178 base pairs 

(B) TYPE: nucleic acid - 

(C) STRANDEDNESS: double * 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85: 

GnACnAGGAA CCGGCACTGA CGAGTCATTT AGACTGATTT TCAAGACCTT TTTAAATGTA 60 

GACATTGAAG TTACTACTCC TGAAGCTGGG GTTATTGATA TCTCTTTAAA AGGGGTAATA 12 0 

AAAACAAACT TTACTACATT TATTTCGCCT AGCACTAAGA AAGGAAAACG ACTAAAAAAG 180 

ATAATTCTTA GAGAAAAGAA GCCGGGATAC GCTGCATCTA AAAAAGCTTT AGTATTTAAC 240 

TCACTTCCTA AaGGCTAtGA TCATTCAATT TATGCTTTTA TTAAGAGAAT TATTCCTATT 300 

GGTAGAGTTC TCAAAATTAA TAATACAGAT GGTAACAATA TTATTACTTT CAATAACTAA 3 60 

GGAGGTTTTA TGGCTGATGA TCAAGAAAAA TTACTGATTG ATGAAGAAGA AACGGTTCAA 420 

ATT AAAGATT - TAAATAAGGT TACGACCGTT AACAATACTG ATCTTTTACT GCTTGATGAT 480 

GGAGCTGCAA GCAGCAATGC TATCACCTTT AAAAACTTGT TAAAAACCGT TAATCACCAA 540 

ACATTTAAAG GCGAAGAGCT AGGCTATTTT AAAGAGATAA TTAAATCTAC AATCGCTACT 600 

GAAGTTGCAG CTGATAAAGA TTTTATAAAA AGCATTTACG ATTTAATCGT TGACAAGCTA 660 

ATTGAGAATG AATCTAGTAA ACTTTCAAAT CTTTTTAGTA AAATCAAATC GCGCCTTACA 720 

GATAGCATAT CATCAGCCAC TTTATCTAGA AGTGATGATC TTTTGATAAT GCCTTCATCA 780 

GATACTATTC AAAAAACACC CGTTCCTAAA CATATACTTG GAGTACCATC AAATTTTACT 840 

TATGGCAGCA TAACTAGAAG TACTACACTT TATCCTTCT6 ACTATGAGAA TAAAGCGATA 900 

TCTATTAATA TGGAAGACAA TGATGATGTA ACTCTTATTT TTTACAAAAA TTACGATAAT 960 

GATCCCATTT ATCTGGATAT TGAGATTCAA GTAAAAATCA ATGGATAATA GGATGCAGAA 1020 

AAAATCATTA AAACTTATGT nTTCTGATGA AATTACATAC AATTGGGTTT ATGAAATACG 1080 
GGCCCTCGCG . GACTATTCAC. CAGAACTCCC ATTATAACGG AnGGTATATC CAAAAAAGAG . . 1140 

CCTCCTGTAT. GGAGATCGTC CCGATCTTTA AAACTGTA 1178 
(2) INFORMATION FOR SEQ ID NO: 86: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1177 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 86: 
CATATGTATA ACAAAAATTA TTTTTGTCAG GCTTTTTACA GAAATTATTA TAATAAATAA 
AAGCTTTATT AAATTCTCAT GTTAAAGAGC TTAAGAAAGC CGCTGGCTTA GCTCAATTTA 



6.0. 
120 
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TTTTAGATAA ACTCACTAAA TAATTAAATT CAGTTCAATT TAGAATTAAA ATTATTTTGT 180 

ATTTGTTAAA ATAAAAGAAC CTATTTAAAT TCTCTTGTTA AAAAATTCAA ATAAGTTCTA 240 

CTTTAAAGCT ATATACTAAC TTATTACTTT ATAAAATTTT AATCATTCTT AATTTAAAAA 300 

ATGCTTATTG AATATAGAAT AAATAATTGG AGCAAGCGTT ATTCCCATTA TTAAAATTAC 360 

TTGTATTGTT CTATTACTTG CAGTAAGTTC GTTTTTTAAA ACATTTATTT TATTATCTAG 420 

GCTAAATATA TCCyTTtGTA AGGTTTTTTC TACACTATCT ATTTTAGtAT TCAAGCTaGA 480 

TATATCTTTT TGCAAAGTTT TTTCTACATT ATCTATCTTA GTATCTAAAC TATCTATTTT 540 

AGAATTT7VAA TTCTTCTCTA CACCATCTAT TTTGGCATTT AAATTCTTCT CTACAGTATC 600 

AATCTTAACG TCTAAATTGG ATATATCTTT TTGTAAATTC TTTTCTACGC TATCAATCTT 660 

AAAAATAAGA TTATCAAATT TTATATCAAA TTGTTTTTCT AAATTTTCTA AATCTCTATA 720 

TGTTAGCTCA TTGTGATAAT ATCTTTTAGA TAAATCTTGT GCTATTAGTT GTTCCATACC 780 

CAGTCTAATA AATTCTTTAT ATATTTGTTC TTGAGTTACA CTTGCAATAT TTGTTGACAC 840 

TGTTTCCATA AAATTTTCCC TTATGGTCAT ATTATATACT ATTTTAGATT AATTGGCTTT 900 

AGAGATTTTT ATATGTAAAA TAGAATTTCT TGCAAGAAAA ACCTTTTTGT AATTTACATT 960 

TTTAACTGGG AATATTTATT ATAGACTTTT TCCGCTATtG GTTTTGTTTT TTTAATGTAC 1020 

TCTAAATATA TGTTAATATT ATGTCTTACC GCAGTTATGG AGTGnTCGTC TTTTAGnGTT 1080 

GATAAGTCTG GATAAGGATA TCnGGATAAT TGGATCATTA ACTTTAACTT. TTGGTTTAGC 1140 

CAAAAAnGnT ACCAGGnACA TAACATACTC TGAAAGT 1177 

(2) INFORMATION FOR SEQ ID NO: 87: 

(i) SEQUENCE CHARACTERISTICS: 
, , , (A) .LENGTH: 11.3.7 .base pairs . , , . . 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 

TCACGnCCAT GTtGtAAAAC TGTTCATCAG AAAGTTCAGT TAACAAAATG TAGTCATGAC 60 

TACCTAATGT CACTTCAATG TTAAAAACAt AAgTTATCGT TTTGGGATCT CTTAAGCTTA 120 

TTACAGGCAT ACCTTTATCT TCACTACTAA TTACTGCTGT TGTTGTAGGT TCGCTTGTAA 180 

GCTCTAGTTT GCCACTATGT AGCTGTGTAC CACCAATiGA AAAATAAACT TCTCTTAAAT 240 

CATAAAATTG CATTTTAGCC CCCCTTTTAA GCACTTAAGC TGTTTTGATA ATCAACTATA 3 00 

TCTTGAGTAG TGATTACTAA AGCAACAGCA TTAATGCTAA AGTTATAAGT AATATTCACA 360 
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CTAAGTTCTA ATTTAAGTTG TGGTGTAGGA GAAAGGGTAA C3GTTTAAGTT TTTATACTCT 420 

ATAATCAATC CCCTGTCGAC AAACCTTTTA AGAAGACATT CAATTGCTGA AGTATATGCA 480 

TTGTCTCTAG CACCACTAAG TTGTAGTGCA GATAATTTGC TATTTTGCCT ATTGTTTTTG 540 

TTCCAAATTC TAATAAGCTC AATAATCGCT TCATTTTTTA TATAATGATA AGTGAAAAGC 600 

TCGTCTATTG AACTTCCAGC AAGATCAACG CTCTCTTTAA AGGCAGGCAT ACCATCAAGA 660 . 

CCAGTTTCAT TAAGAAGTGA ATAAAAGTTG ATTTTTGCAG TTCGCAACTT TCCAATTACA 720 

GTATCATCAA CAAGTGGTGT AGCAGCCAGC GGCATGCCAT AAGGATTTAC AGCATGAAAA 780 

ATACTAGCCT GATGTAAATA TTGACTTATA AATTTGAGGT GTAAATTGTC TTTATTATTA 840 

CTGTAAACAG CAATATTTCT TTCTTTTTCA GTATTGCCTT TATCTTTAAA TAGTTCTTTT 900 
ATTTCTTGTT CTTTAGTCGA GAATACAAAA AAAATTGAAG GTGTTTTAAA CTTATCATAA ■ 960 

TCATCTTTAT AAATCTTAAG TCCATCATCG GAATTATCAC CCTCAGTATT AATAAGTACA 1020 

ACAAAAGTGT GTCTATGTAC TTTAAGATAT TTTTTTAACT CTTCGGGTTT ATCCTTATAA 1080 

ATAAAAAGAA CAGCGGATTT TAATGATTCT TCACTTGAAT TGAAAAAATT TGACATT 1137 
(2) INFORMATION FOR SEQ ID NO: 88: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1091 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 88: 
, GTGATTTTTG A^CJATATGG . ATGATTGTAG GTATTTATGA TGTCQCACTC AAAATTATTT .6 0^ 

TCAGGTGCAT ACGCCTTAAA CCCTTTAAAT ATTTGAGTTA AATGATTTAA TACCATATCT 120 

AT^GTGAAAA TCATTCAAGT GTTACCTTAT AAGTAATCTC TGATAACATT TTGGCTGTAT 180 

CAACAAGTGG AATTGCTGCA GTGTTACTAC CCCTTTTAAA CTTACTTTTG ATTGTATTAG 240 

CCTTTAAGGC TGGAGTGACT TGTGCTGATA GTAGATAATT TTCATAGTAC CTTATAAAAG 300 

CTTGTCCAAT AGCCTCCATT CCCTATTTAG GGTCAAGATT AAACTTAGAA TTTATATAGC 360 

TATTATTGAT ATATTCTCTA AACTCArAAC TACTAGcAAT TTTGGTTAAA TGTTTTCTTG 420 

CTGGTAAATT GCTATTCCCT TTTTCATGCA TTTTAGCAAT ACCTGCACGA CCACCAAACC 480 

ACCCAATTTC CAATTCCATT TTAAATTCtA GTTTGTCCAT ATAAATTCCT TTAAAACCAA 540- 

AGTAAAATAT CCGATTGAAG AGTCAATACT AAATATTTCA AAGTAAACTA AATCTGCAAT - 600 
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660 



TTGAATATCA GACATATCAG AATCATAAAG AATTGCAAGT TCTTGTGGCT TTATGTCAAT 



720 



AATAACTCCT GCGAATTCAG TGTACTTATT TTTATCAAAT ACTCTCTGAT AAGAAGAATC 



780 



ATTTTCAAGC TTTACAACAG TACCTTTATA AAACTTTAAG GGTTTAGGAT CCTTAAATAC 



840 



GTTGATCATr CGAAATGACA TATCAGAAAG TCTTTTyCTA ACACCATTCA TTAGACAACy 



900 



CCCACACAAG ATGGCGTTGA AGTTTCTCTT TTTArTTTTT CTAAAAATGC ATCAAGTTGT 



960 



GAACAAAAAy TCTTGTTTGA GCCACAACCC CCCTCGCCAC CTTCTTCGCC TCCACTGCTA 



1020 



CTAGGATAAT AATCAAGTTC AAGTTCATTG AATTTCTCTT TTTTGATCCT ATCAAATTCA 



1080 



AATTCTCGAA C 



1091 



(2) INFORMATION FOR SEQ ID NO: 89: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1081 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 89: 

GGGAAATAAA TTCAAGAAGC AGGTATAATA ATTTTTATAA AAAAGAAGCA GATTTTTTAG 60 

GTGCTGCTGT AGAACTTGAG GGGGCTTATA AAGCTATTAA GCAAACTTTA TTATAGATCA 120 

CAAGGTATAA ATTTAAGGCT TAAGCCAATT TATCAAAAGA GAGGCATGTT TCTTGGTTTA 180 

AAAGCATACT TTGCATACTT CTCTTTTGAG TACTACTATT TGAAAAGCTA TAAACTTTAA 240 

CCTAATAGAA AAGCCAAATC TTTTTAAAAA TTTCTAAAAA ATAATTCTAC ATACTCTCCT 300 

TATTACATTA AAAAATATTA TTGCTTATAT AAGGCACATA GTATAAAGAC ATTAATCAAA 3 60 

ATTACCTTTT ACTAAGGTTT CAATCTCTCT AAACATGGAT AAGAACTACT TGATCAAGTT 420 

ATAACAATCA AAACCCACTT TCTTTAAATA AAAAATCTTT TAATAATAAA ACCAAAATTC 480 

CAGCCTTACT AAAGACCCTT ACTCTCTCGT GGATTTAATC TTCTTTATAT ATAAGGGTTA 540 

GGCGTATCTA AAGATTTAAT CATTTTGAAT GATAGGGAAG AAGAATTCAT AAAGAATAGG 600 

CAAAAGTGGT TTAGTTTACT GGAGCATATA CATTTAATTA TAAATAAGAA ACAATATTTT 660 

CCATAAGAAC TGGAGTATAT AAATCATAAG AATAACTATT TTATAAAGAA TAAGTAAAAG 720 

TAGTTTAGTT TACTGGAQKCA TTTATCTATG TTAAAAGTAA ACGCACGGCG TATAAAGCCC 780 

CTACTATAGT ATCCAATATT TTTTGAATTT AGGTCAATGT TGTTTAGTGT GTAAATAAGA 840 

ATTATTAAGT GTGAAGATAG CCTATTTTTG CTATTCATAC TTAATATTTC TTTTAAAAAT 900 
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TTTTCCAAAT AGTGCCCCAG TAATTTTTAT TATTTATCAA ATAAAAATAT 



ATGTCTTTAC 



960 



ATTTATATTT CTAAATTGCT TAATTTGCAA AGAAATATTT TTTACGATTA 



AATAGTAGTA 



1020 



GGATAGTTTA GTTCTAACCG GAGTTTTAGT TTATCTGGTA TTGGTTGATA 



GTAGnCnTGT 



1080 



A 



1081 



(2) INFORMATION FOR SEQ ID NO: 90: 



(i) SEQUENCE CHARACTERISTICS: . * 
<A) LENGTH: 1078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doiible 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 90: 

GATCCATATG TGTCCCCTTT ATTTTTAAAT AAAAGATATA TATTTAAAGA CAGTTAGGCC 60 

TCTTTTAGGC ATATTTTTGT TTAATAAAAA ATATTAAATT AGGGTTTATA ATTTTTATAG 120 

ATGAAAATAA AATAGAAGAA TCTAATTTAA CTAAACAATT TTTGTTTAGT TAAAATGATA 180 

TAGGGCTTTG CAAAGTAGAT ATAATTAAAG AAAATCTAAA ATCGCTAAAT AAAACTATTT 240 

AAACTAAGCC CCATAATGAA AAAGTTTTAG TAAAAATATT AAAGAATA,TT TTTACTAAAA 300 

TAAAAATTAA ACCAGCATTA ATAATACTTA CATTAGATGA TTAGCTACTT TTTTTAATTA 360 

ATAAATTTTG CATTTAAAGT TCTATTCCAC TTATAAATAT TGACTATATC AATAATTTTT 420 

CaAGCATTGG TACATTTTAT ATTCtAAATA TTTCGTTTTG TCGCTAATTT GTTGACATAG 480 

GAATTATAAA AAGGCCATCA TCTTTTAAAT TAAAAAGTAA AATAATACTA ATAAATAAAG 540 
ACCATCAAGC CCCGTGTTTT TTTTACTAAT.- AATACAA.TTG CATTGAT^TAT GGTTGTTATT - .600 

GATATTATTT TTTACTTTGA CAATGAATAT GAAAAAATTC TTTATTCTAA ATAAAGAAAT 660 

TGGTATTGGT AATTGCAATT TATTATTTTA TTTATATTTT TTAAAAAATA TAAATAAAAT 720 

ATAATAAAGA TTTATGGTAG AAAGCAAACA TCAAAAATAT TATTTTTATT CATTATTTTT 780 

GTCAGAACTT GCAAGGACTPT TGCCACATGC TGTATTAACT ATTATTTTAA TAAATAAAGG 840 

GTTATCACTA AAAGATATTG GTATGGTACA AATTTGTTAT ATGGTAGCAA TTATTATTTT 900 

TGAATTTCCA TCAGGTGTAA TATCAGATAT TTTTGATAGA AAAATTGTTT ACTTGGTGTC 960 

AATTTTTCTA TTAaTGmCTT CTTATTTTAT TGTTGCTAAA ACCTCTTCAT TCGnGTTTAT 1020 

TTGTGTTTCA GGTTTATAnA nGGGATGTCA GCnGCilATAG CACTGGCACG ATGACATA 10T8 
(2) INFORMATION FOR SEQ ID NO: 91: 
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(i) SEQUENCE CI 




'ERISTICS : 



1073 



(A) LENGTH: 1030 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 91: 

CCATTTTAAA AAATCAAATT TTACAATACA TTATTATTTG CCACCTTGTA AATATTTCAT 60 

AAATAGGGCA TTCAAAATTG GCCCTAGAAT TGCTGCTGTT ATTATCATAA AATGTACTAG 120 

TCTGTTACCC ATGCTAAGTT TTTGATTTAA ACTCTTTTCT ACATTGTCTA TTTTGATATT 180 

CAAGCCATCC ATTTTTAGGT TTAAATTCTT TTCAACATTG TCTATTTTAG TGTTTAAATT 240 

CTTTTCTACA GTATCTATTT TAGAGTCTAA ATTATCCATT TTTAGGTTTA AATTCTTTTC 300 

AACATTGTCT ATTTTAGTGT TTAAATTCTT TTCTACAGTA TCTATTTTAG AGTCTAAATT 360 

ATCTATTTTT AGATTTAAAT TCTTTTCAAC ATTGTCTATT TTAGTGTTTA AATTCTTyTC 420 

TACAGTATCA ATCTTArTrT CTAAATTAGA TATATCCTTT TGTAAATTCT TTTCTACAGT 480 

ATCTATCTTA GTATCTAAAC TATCTATTTT TAGATTTAAA TTCTTTTCCA CACTATCTAT 540 

TTTGGCATTT AAATTCTTCT CTACACCATC TATTTTGGCA TTTAAATTCT TCTCTACACC 600 

ATCTATTTTG GCATTTAAAT TCTTCTCTAC AGTATCAATC TTAACGTCTA AATTGGATAT 660 

ATCTTTTTGT AAATtCTTTt CTACGCTATC AATCTTAAAA ATAAGATTAT CAAATTTTAT 720 

ATCAAATTGT TTTTCTAAAT TTTCTAAATC TCTATATGTT AGCTCATTGT GATAATATCT 780 

TTTAGATAAA TCTTGTGCTA TTAGTTGTTC CATACCCAGT CTAATAAATT CTTTATATAT 840 

TTGTTCTTGA GTTACACTTG CAATATTTGT TGACACTGTT TCCATAAAAT TTTCCCTTAT 900 

GGTCATATTA TATACTATTT TAGATTAATT GGCTTtAGAG ATTTTTATAT GTAAAATAGA 960 

aTTTCTTGCA AGAAAAACCT TTTTGTAATT TACATTTTTA ACTGGGAATA TTTATTATAG 1020 

ACTTTTTTCG 1030 
(2) INFORMATION FOR SEQ ID NO: 92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1028 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
- (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 92: 
TTTTGTTGAA TTTCCTGTTA AATTTTCTGA ATTGGTGTGA TTGCTTGTGT TTTTTAGATT 



60 
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TCTAGAATTG TTGCTTCGTT TTGTTTTTTT TAGACTTTTA 
TTCGTTTGGG TTAACATTGC CAAAAGGTGC ACATGATATG 
TGTAATAACX3 TTAAGTTTAA TAATATTTAA TTTAAAGTTT 
AATTTGAATt AATATTTATT AATTTTAGT T CAAATATATA 
TATCAAATAA GTTTAATATT ATTTGATATT GAAAATTTAA 
GTGGATTTAG ATTGCATGAA TTTTAAAAAT /yUVAGTTAAT 
AAGTGTAACA ATTTGTTTGG ATTTAATGGG TTTAATCTAA 
GAAATTATAA CGAACTAAAA GAACAATTAA AATTAAATTT 
AAATTCAAGA AATGAAAATT CTACACGAAA TTAAGCAAAA 
GTTTTAAAAG TTTTAAGCAG TTTATAAAGT CTTATGTAAT 
TGTATTTGAA AATTTATGAG AAAGTTTTAG AAGGGTTTAT 
AAATGGGCTT TGTAGCTGCA TATAAAAATA TACTAAAGAA 
AAGAAAACAT GATTGAAGAA AATATAGCAG AAGATGGTGA 
AAATTTTAAT TAAAGATAAA GAAGTTTATG ATTTTTGCAA 
CTTTTATTTT AGGGGGGTTC ATTAAAGCAT TATTGAATTA 
TGTATTTTTA TTAGCAATAT ATTTTCCCAT AGAGGCTTTT 
ATAAGATT 

(2) INFORMATION FOR SEQ ID NO: 93: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1002 base pairs 

. . , . . ^(B). .TYPE 1^. nucleic, ;acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



m 
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GAAGTGGTAG GATTTTTTGG 120 

CAAATTGAAG TTAATATTGC 180- 

TTCAAAATAT TCTCCTTATA 240 

ATATTACAAT TTAATATCAA . 300 

TTTCTATTGA TGTTTTTAGC' 360 

TCTTCTCTTT TTAAAATATG 420 

GGATCAAGAT GAGGAATTTA 480 

GAAATCTGAT ATTAATAATA 540 

ATAACTTTAT AAATATGACT 600 

TGCCAGAAGT CAAGTGTATA 660 

TTCTATTGAA AAAGTTAAGG 720 

CAACTCGTCA TATGTATATA 780 

TAGTCAAAAT ATGTCTATTA 840 

AAAAGATACT T^AAAGAATAT 900 

AGTTGGAGAA tTTTTCTTTT 960 

TGTGTCTACT AGAATAGGTA 1020 

1028 



(xi) SEQUENCE. DESCRIPTION: SEQ ID NO: 93: 

AATTTTTnAA AAAAAAAAAT TTTTTTTTTA AACCCCCAGG GnAAAATTTG GGGAAAACCC 60 

CCCCAAGGCC GTCCTTTATG GGTCCTGCCT TTAGCCCCAG AGGACGTTAA AATTGGATTT 120 

ATTCAAACTT TTTATAATTA AAATTGGCAC TGTAAGGAGT TTAAACAACA AACTCAGAGG 180 

CTATTGTTAC AATACCCGAA TTTGAAGATT TAGAAATTCA CACAAAAAAT ATCTCTAATA 240 

TCAGTTTAGA ATTATCAAAA GGTGATAACG TATTGCTACT TCAATCAAGC GTTAATATTT 300- 

TTGATAAAAA TAACGATAyC CACTTTGACA AACATCATTT TTATATACTT AGTGCAATTA 360 
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GCCCAAAGAC TTTAAATCTA ATTTCTGATA CTGTTAAAAT TAAAGCAAAC AATAAAATTG 420 

AAATAGCCAA TGAAATAACT TCCTTAAAAT CAATTCTAGA GAGTATTGTA AGTGCTATTA 480 

ATGGAATTAC TGTAAAAGGA CAAGCGGTCG TTGACTATGC AAGCTTACAA ATAGCAACAT 540 

CTAGAATTAG CAATAATATT AATAGTTTGT TTAAGTAATT TTTGCTAATT ATGGfATAAT 600 

TACTAGTATG GATTTAAGAT TAGGCAATAA TTTTGAATTG GTATTTAATA AAGATATATC 660 

ACTTGTTGAT GGAATTGATG AACAAAAACA AAGaTTTTTG ATATTTTTAA AAACCTTAAG 720 

GGGTAGTTTA AGCTATGCTC CTCATTGGGG . ATTGGACTAT TTCTTACTTT TAAAACTGTT 780 

AAAAATTAAC AATCTTCACG CTGTAAAAAA TTATTTTCAT GAAATATCTA AAGAGCTTAA 840 

CTTAGrTTTA ATAAATATTT CAACTACTAT ACAAGACAAC AAAGCACATA TATCCyTTTT 900 

TTTCTCGGGC GATGTTTTAA ATATGGAGtT TAATTTaTGA GCtAGTTTTT GATTCTGrTT 960 

TgGcwTTTAA AACGTACAtT AAGGgTATTG TAAGAGCTAA AA - . 1002 
(2) INFORMATION FOR SEQ ID NO: 94: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 998 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 94: 

GGGCATTATG TACTGATAAT GATGATGCTT TAGAAGATCT TTTTAAAAAG AATGCTGAGC 60 

TTAAGAGTAT AGAATATTGG GTAAATATTT TAAAAAAATA TTTCAATAAA ACTAATAGAT 120 

TTGATGATCT AAATAAGCTT AAAGTATTTA TGTCTGATAA TCGAGACGTT TATAAAACAA 180 

AAGTATTAAA ATTCTTTTGC ATGTTGAAAA AAGAAAGACA ATTTAATTAT ATATTTGCAG 240 

CATAGCAATA TTAAAGCCCC CAAATAGGGG GCTGTTAGCT ATTAGGAACC ACCATTGTTG 300 

CAGTTACTAA CCGCATT6TT TGCAAAATTA TCTATATTGC CGCCGCTAAA GAAACCCT6A 360 

ACTGTTTGTT TGAAGGTGCT TTTTTGTTGT TCAGAATTAT CCCCAGTACA CTTATCAAGT 420 

TCACTCTTTA TATGATTAAG. TGCAGATTTT ATTTTGCTTT CATCATATCC TAAAAATTTA 480 

TCAAATTCTC CATCATTACC CAGAGCTTCT TTTAACCAGT CAAGGTGTGT TTTCTGGTCT 540 

TCAGATAGCT TTTCTCTAAG TAGTTCTTCT TTAGATTTAG GTTTTTCTGG TGTTGCTTCT 600 

TTTTGGGTTA AATCACGCTT TCCCCTGCTT TTTGTTTGTT GTGCATTGTT TTTTAAAGTG 660 

TCATTATCAT TAGAATTGCA GCTATTTAGT AGTAGTAAAA ATAAACAAAA TAATATGTTG 720 

ATGATTTTCA TTGTTATTTC CTTTCCTTAT CTCCAGTACA ATATGTTGAG TAAAAATAAA 780 
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ATTTATTCTT GTAATTATAG AGCTTATTTT TAAAAATCTT TAAA/VATATT AATTGAGAGA 



840 



TTTATATTTT TCGAATGTTG TGCTAGCnTT TATTTCATTA TTATTGAATA TAGGAGTAAC 



900 



TAATGAGAAA TAAAAACATA TTTAAATTAT TTTTGCATCA AGGGATTTGT AATGGCTGTA 



960 



AAGCATATGT AGAAGAAAAG AAAGAAATGA TCATAATG 



998 



(2) INFORMATION FOR SEQ ID NO: 95: 

(i) SEQUENCE CHARACTERISTICS: - . 

(A) LENGTH: 996 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 95: 

AAAAATATTT TTATTTATAT TTTATTGTAA TTATTCTTAA ATGATATATA ATATCAATTA 60 

AGAATAATTA TTATTTATAA TATATATTCC TACTTAGATA AAAGGAGATA TTTTTATGAG 120 

AAAAAGTTTG TTTTTATATA CATTATTAAT GGGAGGATTG ATGTCTTGCA ATTTAGATTC 180 

CAAATTATCT AGTAACAAAG AACAAAAAAA TAACAATAAT GTAAAAGAAG TTTCGAATAG 240 

TGTTCAAGAA GATGGTCTTA ATGATTTATA TAGTAATCAA GAAAAGCAAA AAAGCTTTAC 300 

TAAAAATTTT GGAGAATGGA AATATGAGGA TTTAATTAAT CCTATAGAGC CTATAATACC 360 

TTCAGAATCA CCAAAGAATA AGGCTAATAT ACCAAATATT TCAATTGTGC ATACTCAAAA 420 

AAAAGAGATA AAAGAGGAGG ATTTAATCCC TTCTACTAAT GAAGAAAAGG AAGCTGATGA. 480 

AGCAATTAAA TATTTAGAAG AAAATATTCT TCAAAACTCT AAATTTTCTG AATTAATTAG 540 

AGAAGTACGT GTAC.TTAAAG ATGAATATGC TTTAATAAAC TCTGATTTTT ATGATGTAAT . 6.00 . 

TGAAAAGATT CACAATAAAA AAACATCATT AATGGAAAAT TATAAGAACA ATAGAGATAA 660 

GATAAATAAA TTAACACTGT TGCAAAATAA TTTAAAGATA AATATTGAAC TTGAGCAGCT 720 

TATAAATATG ATTGATATTG CAGAAAATGA AATAAGATCT GCGGCTTTCT TTTTTGACAC 7 80 

CGCTCAGAAA AGGTTAAAAG AAAGTATTAT TAAAAGATTA GAGAGTAAAA ATAATAGATC 840 

TTATTATGCA TTAGAATTGT CTAGACAGGC TTTAAGTGAC GCAAGAAGTG CTTTAAGCAG 900 

TTTAGAATCT TTTGCTTTTA AAAGAGCTGA ACCAATGGTA AGAAAGAAAA AAATAAAAGA 960 

GCTTATTAAA CATGCAAAAA CTGTTTTAGA AAGTCG 996 

(2) INFORMATION FOR SEQ ID NO: 96: 

• (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 986 base pairs 
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(B) TYPE 

(C) STI^ANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ. ID NO: 96: 

CGGACTATAT "ATACTAAAAG GGACTTGTGC TT'GTATTCTA TTGGCTAGTT GTTCTTTTAC 60 

AAGATGAGCG TCAAAGCGTA CATaGTATTG CCAAAAACAG TCATTTTGAG TAAAGAAATC 120 

ATATCCTTAT ATAAGGATGT TAGTATTCCC CCGTTTAATG AkATATGTTC ACCAGTCATT 180 

ACCGGATTGT AGCTTACATA TTCCGCTTTT CTATCATAAT AATTGATAAC TGGTCTTTTA 240 

GAACAACTAG TATTATAAGT GCGTGTTATG AGTTCATTTT TTGGTTTTAT AAAAAACAAT 300 

TGAGGAATAT ATCCAAAACC TTTTAGATCC ATTCTAGGAA ATAACACTAA AAAATTATCT 360 

GcTCCGAAAA GGGCAAATAT TTGGGTTATt ACATCTCTTA TTATTCGAGT AATCTCCCTG 420 

ATTTCTTcTT TtCAATATCA TTAATTTTTT CCTTGATTTT TTTCTTTtCA ATATCATGAT 480 

TGTTAGTAAT TTTATTATTA ATATCTATTT TGTTAGCTGC ATTGTTAGCA ATTTTTTTGT 540 

TACTTGTCAT AAGTAATTAC CTTTTGTAAA AATTATGGTG TGCTGTTAGC ATTGTCTgAT 600 

TTTGAATTTC TTCTTGTAGT TTTTTTAGAG CCGCACCCTC ATCTCCGCCC ATCCATCCAG 660 

GTAGCATCGA TTTtAATTTk GCAAAGAAAT AATtAAGATt AAAAATACTT TtAATGCCAT 720 

tAATtAtGGG ATAATAAtGT GTGTTTCAAA CGCAAaGTCT TtAAaGTAAT aGTTATCTTA 780 

TAAGAGGTCA AGTAAGGGTC CAAGACAGTA GTGGTTAAGT TTTGAAGAGT TTGCTCAGCT 840 

GAGGCCAAAT TACTTGAATA CTCTCAGCAT ATTGACTTTT TTGTAAGGCC GAAAGATTAA 900 

AATCCTCGAA CATTTCCATC ATCTGGTAAn TCTAGACTCT AGAnCTACTT GTGCCCCGCT 960 

TTGCCAGGCC ATTTGGCATC TTCTAT 986 
(2) INFORMATION FOR SEQ ID NO: 97: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 976 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 97: . . - ' 

ATTGAGCACT CCTTTACATA TTCATCAAGC TCGCTTTTTA AAGAATTAAT TTCTCCATTA 60 

ACAACTTGCT TGTTTTTTTT ACTACTTGCT TTATTTAAAG CGTCAATTTC GGCTCTTAAA 120 

TTTTCTATTT TAGTATGCAT ACTAACAAGC TCAACACTAG AATATTGCTT AAATGCATTT 180 
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ATAAATCCTA ATTCTAAATT AGCCCGCTCT AAATCCAATT CGCTTCTAAC TTTCCTAGCG 240 

TTAACTTCTG ATCTAAAGGT TTGCGACAAA AGGTGTTCAA AAGTATCTTC ACTAATTGTT 300 

ACTCTAGAAT CCTCGCTAAC AGAAGTTTCT CCACTTTCCC ATTTTTGTCT CATTCTCCAC 360 

ACATTTACCC TAGAAACTCC CAATTTAACC GATATTTCTC TATCATCTAA CGATCCTTCT 420 

CTAAAGTATG CAACATAATC ATtAAAAGAC CTTTTAGCTC TTTTCAAAAC AATTTCTCCT 480 

AAAATAACTA AATTAACAAA TTGTTACTCT- AAATAGTAAA TCAATTTGTT AATTGTTAAC 540 

ATTAACTATT ATCTTATTGA TATCTATTGA CAGGTGTTTG GTATTTTTTT GACTTTTATT 600 

GATTTAGAAA TAGCAATTAA CTAATTTATT GAATTTTGCA ACAACTTGAC TATATAAATT 660 

AGGGAAAATC TTTTATTGTT TTAATTAGAT CATCGCTTGT AAAAATTCTC TTATCATAGT 720 

TGTGkATCCT TATAAATAGT ATATCTTTAA ATTCGTTGAT CATAATTAAT TGATATTGTT 780 

TTGAAACTTT TTGATAAATA TGGTTAAGAA TACCATAAAC AGCCCCCAAA AATATCATGG 840 

AATCATACTC TCCTAATTTT TTCAAACATT TCTTTAGCAT CCCTTTCTTG TCGCTATAAT 900 

CAACTTGCAT ATTTTTGGAA TTTTTATATT TTTnTATTAA ATATTTATTT TTCAGAACGT 960 

CTTTAATAAT TTTnTT 97 6 
(2) INFORMATION FOR SEQ ID NO: 98: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 968 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 98: 

GTCAGGCTTT TTACAGAAAT TATTATAATA AATAAAAGCT TTATTCAATT CTCATGTTAA 60 

AGAGCTTAAT AAAGCCGCGG GCTTAGCTCA ATTTATTTTA GATAAACTCA CTAAACGATT 120 

AAATTCAGTT CAATTTAGAA TTAAAATTAT TTTGTATTTG TTAAAATAAA AGAACCTATT 180 

TAAATTCTCT TGTTAAAAAA TTCAAATAAT TTCTACTTTA AAGCTATATA CTAACTTATT 240 

ACTTTATAAA ATTTTAATCA TTCTTAATTT AAAAAATACT TATTGAATAT AGAATAAATA 300 
ATTGGAGCAA GTGTTATTCC CATTATTAAA ATTACTTGTA TTGTTCTATT ACTTGCAGTA ' 360 

AGTTCGTTTT TTAAAACATT TATTTTATTA TCTAGGTTAA ATATATCCTT TTGTAAGGTT 420 

TTTTCTACAC TATCTATTTT AGTATTCAAG CTAGATATAT CTTTTTGCAA AgTTTTTTCT .480 

ACATTATCTA TCTTAGTATC TAAACTATCT ATTTTGGCAT TTAAGCTCTT TTCTACATTG 540 
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TCTATTTTGG CGTCTAAaSPaTCTATTTTA GAATTAAGTT CATTTTTAACACTATCTATT 600 

TTAATATTTA AATTCTTCTC TACATTATCT ATCTTAGTAT CTAAACTATC TATTTTGGCA 660 

TTTAAGCTCT TTTCTACATT GTCTATTTTG ATATTCAAAC CATCTATTTT TAAATTTAAA 720 

TTCTTTTCCA CATTGTCTAT TTTGGCATCT AAATTAGATA TGTCTTTTTG CAAATTCTTC 780 

TCTATATCAA TTATTTTCTC TTTTAAAAAT TCAAAGTTGT AATaTCATTA TGCAGAAAAA 840 

CAAAATCTAT gCTtCCTgCT AAACCCTATA TTAAAAATTC GTTTTTAATA CCTTTCTAAT 900 

GGTTAATAAT GGTTTGGTAA TGGCCTAAAA TTGGTTCCAT AAGGATTAAC CCTTTTAAAT 960 

GGTTTATA ggg 

(2) INFORMATION FOR SEQ ID NO: 99: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 954 base pairs. 
(B.) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 99: 

GCAGGTCGAC TCTAGAGGAT CCCCTTTAAC TAGAATTTTT CAAAATGATA AAACTTTAAC 60 

CCGAAATGAT AAAACTTTAA TTTTTGCAAT TTTATTCTCT TGTTTTTTTT AAAACGATTA 120 

GAATAATCGT TGAkCAGGTT TATTGATTAT CAATAAACCT GATCTATAAT ATTATAAGCG 180 

GTTTTTGCAA GTTTAATAGG AGCTATAATA TCCATGAACA AATTATTGAT ATTCATTATT 240 

TTATTAGTCT TTTCATGTAA TTTAAGTAAT TCTGATCAAA ATAATCCACT AAACATGTCA 300 

AATAAAGAAA AAATAAGCGA ATATCAAATA AATGAGTCGT CAAACAAATA TTCAATTTTC 360 

AAACG2^TT' CAAGCGTTAA AAGATA^^ TTCAACCATT- ATTACTAACC AAAATGATAA 420 

TATTAATTCT ACTATTAACT ACCCACCTTA TATTCAAACT ATCTTAAAAA TAGAAAAACA 480 

AGTTGACGGA AATATTAATG GGATGACTAA AGAAAGTGGC ACAGAAACTA AAAAGCTTTT 540 

AGAAATTCTA AATGGGAATA TTTCTCGATT TAAAGATGCA ATTCAATATG GAGGAAGTTT 600 

TAGGGCTAAA GATGTTAGAG AAAATCAAAC CCAAAAAGAA AACAACAAAG ACTCGCATAT 660 

TCATGTCGAC GATTTTAAAG AATACATACA TTTAATCATG CCTAGCATTA cAATAATGCT 720 

GATAGTAGTA GTAGTTATTA CTATACCAAC TACATAATAA ATGGAGACAA TTTGTkAAGA 780 

ATTATTAGCA ACTTATAArA AATCTTTATA AATTACCAAT ATTCTTGACA ATTTTAATAC 840 

TATTTTTTTT ATATACTATA ATATTATGAA AAAAAATCAA AAAAACAAGT GCTdAGAAAT 900 

AGAAAAAACA CAATTAGAAA TAATAAATAA CCAATCAGAA ATAGA/^AAAC AACG 954 
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(2) INFORMATION FOR SEQ ID NO: 100: 

d) SEQUENCE CHARACTERISTICS: 

. (A) LENGTH: 946 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 100: 

AGAAGAAAAT AAATTATACA GATCTTCTGT ATCTTTTAGA TATTTTTTTT ATGATGAAAA 60 

TACAAAAAAG AAATTAGGGT ATAAAAAAAT AATAACAATT TTCAATTTGC TTGATAAAGG 120 

AAGTGATGCA ATAAAGTTTC CCATATTTAA TGGAGGATTA TTTGCACAAG ATAAGGTTAA 180 

ATATTTAAAT AATGAAAGTT TACTCAGTAT TAGTGAGATT GAAGAAATAT TAGTCAAAAT 240 

ACTTTTCTTT GAAGAAAAAA ATATTAAAGA TAAAAAATTT GTAAAATATT CAAGGCTAGA SCTo ' 

TCCTAAAAGC TTTGGAGAAT TATACGAAAC TCTACTTGAA TATGACCTAA GAATTGCAGA 360 

TACTACTGTT CATCGTATTG TTGAAGACGG GATTTATCTC ATTCGTACTG AAGAAGAGCT 420 

TGAAAACAAT AAAGTAAACA AAATTGCTAC ATATCTTAAA GGGAATATTT ATCTTACATC 480 

TAGATCACTT GATAGAAAGA AAAGTGGGGC ATATTATACT CCAGATGATT TAACTGATTT 540 

TATGGTTATA TCATCAATTG AAGAGCAGCT TAAAACCAAG TCCCCTTTAG ATATAAAAAT 600 

CATTGATAAT TCTTGTGGAT CAGGGCATTT TTTAATTTCT TGTCTAGATT ACTTAACAGA 660 

AAAGGTATGG TACGAGCTAG ATAAATTTGA AGATGTAAAA AAAGAGCTTG ATAAAGAATA 720 

TGGGATTATT CTTAAAGAAA GTGAGGAGTA TGATATTCAA GATAGTATAA GTAAAGAATT 780 

GGTGCTTi?^ AGGATGCTGC TAAAGAGGTG TATTTATGGT GTTGATATTA . ATCCTATTITC 840 

GGTTGAAATT ACTATGCTAA GTTTGTGGAT TAATACCTTT ATTTTTGGAA CGCCACTAAG 900 

CTTTATTGAG CATCATATAA AAACAGGAAA TGCTCTCTTG GGATAT 946 
(2) INFORMATION FOR SEQ ID NO: 101: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 913 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: skQ ID NO: 101: 
CTTTGACTCA AAACTTTACC CTTTAAATTG CTAACTTTAA CTTGAAAATA CTAAACTTTA 



60 
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AACTAGAATT TTTCAAAATG ATAAAACTT^AATTTTTGCA 120 

ATTTTATTCT CTTGTTTTTT TTAAAACGAT TAGAATAATC GTTGAkCAGG TTTATTGATT 180 

ATCAATAAAC CTGATCTATA ATATTATAAG CGGTTTTTGC AAGTTTAATA GGAGCTATAA ' 240 

• TATCCATGAA CAAATTATTG ATATTCATTA TTTTATTAGT CTTTTCATGT AATTTAAGTA 300 

.ATTCTGATCA AAATAATCCA CTAAACATGT CAAATAAAGA AAAAAT/^GC GAATATCAAA 360 

TAAATGAGTG GTCAAACAAA TATTCAATTT TCAAACGAAA TTCAAGCGTT AAAAGATACA 420 

CGTTCAACCA TTATTACTAA CCAAAATGAT AATATTAATT CTACTATTAA CTACCCACCT 480 

TATATTCAAA CTATCTTAAA AATAGAAAAA CAAGTTGACG GAAATATTAT TATTAATGGG 540 

ATGACTAAAG AAAGTGGCAC AGAAACTAAA AAGCTTTTAG AAATTCCAAA TGGGAATATT 600 

TCTCGACTTA AAGATGCAAT TCAATATGGA GGAAGTTTTA GGGCTAAAGA TGTTAGAGAA 660 

AATCAAACCC AAAAAGAAAA CAACAAAGAC TCGCATATTC ATGTCGACrA TTTTAAAGAA 720 

TACATACATT TAATCATGCC TAGCATTAAC AATAATGCTG ATAGTAGTAG TAGTTATTAC 780 

TATACCAACT ACATAATAAA TGGAGACAAT TTGTTAAGAA TTATTAGCAA CTTATAAAAr 840 

ATCTTTATAA ATTACCAATA TTCTTGArAA TTTTAATACT ATTTkgTTaT ATACTATAAT 900 

ATTAAGAGAA AGA 913 

(2) INFORMATION FOR SEQ ID NO: 102: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 910 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 102: 

TCGCTATxmG AGCTCGGTAC CCTGATAAGG CGAGTGTGAC GGGGATTGCT AAGGGAATAA 60 

AGGAGATTGT TGAAGCTGCT GGGGGGAGTG AAAAGCTGAA AGTTGCTGCT GCTGAAGGGG 120 

AGAATAATGA AAAGGCAGGG AAGTTGTTTG GGAAGGCTGG TGCTGGTAAT GCTGGGGACA 180 

GTGAGGCTGC TAGCAAGGCG GCTGGTGCTG TTAGTGCTGT TAGTGGGGAG CAGATATTAA 240 

GTGCGATTGT TAAGGCTGCT GGTGAGGCTG CGCAGGATGG AGAGAAGCCT GGGGAGGCTA 300 

AAAATCCGAT TGCTGCTGCT .ATTGGGAAGG GTAATGAGGA TGGTGCGGAG TTTAAGGATG 3 60 

AGATGAAGAA GGATGATCAG\:ATTGCTGCTG CTATTGCTTT GAGGGGGATG GCTAAGGATG 420 

GAAAGTTTGC TGTGAAGAAT GATGAGAAAG GGAAGGCTGA GGGGGCTATT AAGGGAGCTG 480 

GCGAGTTGTT GGATAAGCTG GTAAAAGCTG TAAAGACAGC TGAGGGGGCT TCAAGTGGTA 540 
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CTGCTGCAAT TGGAGAAGTT GTGGCTGATG ATAATGCTGC GAAGGTTGCT GATAAGGCGA 



600 



GTGTGAAGGG GATTGCTAAG GGGATAAAGG AGATTGTTGA AGCTGCTGGG GGGAGTAAAA 



660 



AGCTGAAAGT TGCTGGTGCT AAAGAGGGCA ATGAAAAGGC AGGGAAGTTG TTTGGGAAAG 



720 



TTGATGCTGC TCATGCTGGG GACAGTGAGG CTGCTAGCAA GGCGGCTGGT GCTGTTAGTG 



780 



CTGTTAGTGG GGAgCAGATA TTAAGTGCGA TTGTTAAGGC TGCTGGTGCG GCTGCTGGTG 



840 



ATCAGGAGGG AAAGAAGCCT GGGGATGCTA AAAATCCGAT TGCTGGTGCT ATTGGGAAGG 



900 



GTGATGCGGA 



910 



(2) INFORMATION FOR SEQ ID NO: 103: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 888 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 103: 

AACATGTAAA AGAATAAGCA TTAACTCGCG CATTCTTTGA TTTAAAACAA CCACCCGAAC 60 

TACTAAAAAC CTTATTTTCA ATCGAACTCA TTGATTTTGA ATATTTTTTA AATTTTAAAA 120 

GAACATCGTC AAGTTCTTTA ACTGAATCTA AATAAGGATC TTTTGCCTGT ACTTCTTCAG 180 

CCTGTCTTGT TTGACGTTTA GATCTAGGAG CAACTGGAAT TTCTGATTCT AGCCCTAATT 240 

GTGGATTATC ATCAACATTA GGAGCTTTAG CTTGCCCTTT GCCTTTTAT^ GCCATAATTT 300 

AATTACCTTT TAAAGCTCTA TTCCCAAAAA CACTAGCAAG CACTATAGAT AACTCTTCGG 3 60 
TTAATTTATG TACTTTTGAA AGTGCTATAG CA;rTAACAGA TTTATCATTT, CCCCCATTCT . 420 

TTTCAAGCTC TCCTTGTGCA TTA7L?^TGCA GCTTATCACC TGGGTTTACA CCATTTCCAT 480 

TTTTCTTAAA TGTTAAATAC CCCGTGAAGT TATTTGTAAT TGGi\ACTACA GTTGCCATGC 540 

CAGTAAACTC ATCTATATCA GTGCATATTC CGTACAAGTC ATCCCCACCA CCAGCCTCAA 600 

CTTCTAGTTC TGTTGTACCA TCTGCACTAA AACTAAGCTT GACTCCACGC TTGTATGGAT 66.0 

ACCCTTTAGC AGGATAATTT TCTATTTTGT CTTTACTACT AGTAAAAACT CCATCCGAAT 720 

TGGAGTAAAT TAGATTTTTA TCTCTAAAAT CTACAGAATT ACTAAGCAAA CGAGTATCTT 780 

GCTGAGGATT! TTTCATTAAT GCTTTAATTT CTGCAACTTT TTTATCAAAC TCTTCTTTTA 840 

TTTTTGTAAT ACCATCGCTC ATTAAAAACT CCTTTAAGCA ATACTGGT a88 
(2) INFORMATION FOR SEQ ID NO: 104: 
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(i) SEQUENCE CHSRaCTERISTICS : 

(A) LENGTH: 883 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 104:- 

GATAGTAATT AAGTCCTACA AGCAATAGTG TTACTTTGCA TTAATTTGTT CTTTCCTTAT 60 

CGATAGGTCT CTTCCTTCCT GATTGAATTT CAGATCATTA GATATTTTGA GACTTTCTTC 120 

ATCAGAATTA ACTCAAGTCA ATGCATTGAT TGATTTTCTC ATTTAATGGA GCTAGTGCTT 180 

TATTTATTGC TGGGGTTAAT GCACTCTCAA GTCTTTCCAT ATTTGCTGTA TAGATTAATT 240 

TmTAATGAGA ATACAGCTCA TAAACCAAAA AGAATCCTTT ATGTGCAATT . TCATCAAATT 300 

CATCTTCAAA TTTAGAAAAT ATATCAATAA GGGTTGATAA AGACGTAAGT CCAAGCTCAA 360 

CATTATCTTT GGATAATTTC ATAAGTTAAT CTCTTTTTTT AATGTGATTT TTGCCATTAC 420 

CATTGCCATT CTTAAAAATC TTGCCTATTA CAATAGTCAA TATGTCTTTT AATAAAGGGT 480 

TGAGAAGAAT TAACACTCCT AAAACCAATA CTGTTACAAA AATCATTACG GCTATAAGTT 540 

TAATTTCATT TAAATTGATA AGAAGTTCTG TTAATTTAAT AGTATCCATT TTTTAATCCT 600 

TTATTTTAAT TTTTTATTTG TATATACATT ATATCAAAAT CGTAATTTTT GCTAAAAAAG 660 

TTTGCAGCTT TTAAAGCTGC GGGATGGGGC CCCCTGATAG GTAGGCTCTT TTTTGAATAT 720 

ACCATCCTTT ATACATGGiGA AATCTACTAG ATAGTCCTTG GGGGAGCGTC TGrTTGCTCA 780 

TAAGCCATAC TTGTTTCACT TTCATCGGAA TATCTTAGAT AAAGTACTTT ACTCTCGCTA 840 

TTACTGTAGT GTTCTGCGTC AAGCTCAATA TCAAGGTAAA TGG 883 
(2) INFORMATION FOR SEQ^ID NO: 105: - 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 857 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 105: 

. CTATTAATTG CCAAAAAACT AAACCAAACA ACACTTAAAA GGAGAGTCTT ATTGTGATAA 60 

\- TGAGATATAA AATGAAAATT TTAACTAAAA ATAAAACTTA TGAATATCCG CTGAGAGTAC 120 

TTCCCGTCTA TGAATGGGAT AAAGTGCTAG GATTTAATCA AAGTGACGCT GTTTTAAAGC 180 

TTAATGAGGT TAAATTCTTA AGAGAAATCA CAAGCTTAAT GATAAGTCCA AAATTTTTAG 240 
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ACGAATTCTA TGTGATTTTG GATCAAAATA GAGAATTTAT TTCTTATTAT AAGGACTATC 300 

TTGTTGCAAT AATTTACACT GCACAATTTA ATACTTTTCA TTTAGACAAT AATCTAAAAA 360 

AGCCCGCTTT AGTATATTTG AGTGAGTATG AAAATAATGT TGGTGATTTT GTTGCTTTtG 420 

ACTATATTAA TGAAAATTTT GATTATGAAA AAGTAGCCAC TTCGCTTTCA TCAATTACAT 480 

CAAATTCCAA TGAGCTGGTT GCTAAATGAG CAAAAGAAAT AGAGATATTG ATAAAGCTAT 540 

TGCAAGTCTT GATGAGACTA GAAAAAAATA TTTTAACTTG CTTGACGAGA TTAAGAACGA 600 

TAAATACTTT TTCCCAGTAA TTATGAATAT TTGCTCATAC TACTCGGTTA AAAAATTGCC 66 0 

TTATGACGAG CTTTTAGAAG TCAATAGACT TGCTGAGATT AAATTAGAAA AAGAATTGTA 720 

TGAATTAATT TTAAGCAAGT GAGGACTTAG TGAGCGACAA ATTCACCATT AAAtTTAAAG 780 

GtATTCyTGA TCaTGCTGCA ACAAAAAAGG GCCATTGAAC CAGGATATTT CTAAAATGGn 840 

AAAATTATCn TAAACCT 857 
(2) INFORMATION FOR SEQ ID NO: 106: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 106: 

AGTTGTTCTT TTGCGAGATG CGCGTCAAAA CGTAGCATAG TATTGCCAAA AACAGTCATT 60 

TTAAGTAAAG AAAGCATATC CTTATATAAG GATGTTAGTA TTCCACCGTT TAATGATATG 120 

TTTTCACCAG TCATTACCGG ATTGTAGCTT ACATATTCCG CTTTTCTATC ATAATACTTG 180 

ATAACTGGTC TTTTAGAACA ATTAGTATTG TAAGTGCGTG TTATGAGTTC ATTTTTTGGT 240 

TTTATAAAAA ACAATTGAGG AACATATCCA AAACCTTTTA GATCCATTCT AGGAAATAAC 300 

ACTAAAAAAT TATCTGCTCC GAAAAGGGCA AATATTTGGG TTATTACATC TCTTATTATT 3 60 

CGAGTAATTT CCCCGATTTC TTTCTTTTCA ATATCATTAA TTTTTTCCTC GATTTTTTCT 420 

TTTCAATATC ATTAATTTTT TCCTCGATTT TTTTCTTTTC AATATCATTA ATTTTTTCCT 480 

CGATTTTTTT CTTTTCAATA TCATGATTGT TAGTAATTTT ATTATTAATA TCTATTTTGT 540 

TAGCTGCATT GTTAGCAATT TTTTTGTTAC TTGTCATAAG TAATTACCTT TTGTAAAAAT 600 

TATGGTGTGC TGTTAGCATT GTCTTGATTT TGAATTTCTT CTTGTAGTTT TTTTAGAGCC .660 

GCACCCTCAT CTCCGCCCAT CCATCCAGGT AGCATCGATT TTAATTTTGC AAAGAAATAA 720 
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TTAAGATTAA AAATACTTT^^ATGCCATaA TTATGGGATT AATAAGTG^KT TTTCAAACGC 780 

AAAGTCTTAA AGTAATAGTT ATCTTATTAA TGAGGTCAGT AAGGGTCCAA GACGTAGTGG 840 

TTAAGT 846 
(2) INFORMATION FOR SEQ ID NO: 107: 

(i)" SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 840 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 107: 

CAATGAAATA GTTAGAGAAA TTAAAAATGT TATTAAAAAG CACAATTTGG AGCTTGATAT 60 

TGAGCAATAT CCAATTTCTA TAGAGGGTCA ATATGGCATA GTTGATTATA TTAGGACTAC 120 

ATTCTACAGT ACAAGTACTG GATATGAATT TTCTTTTGAT ACGCGAATTC CTACAGAAra 180 

TTtACAATGG aACAATGAAA ATGGGTCTAA AGTTACAAAT ACAGTGTATC AGATGTTTGG 240 

TTCAGGCATT ACTTATGTCA AAAGGTATGC TTTAGTTGCA GCTCTTGGTA TAGAAAGTGA 300 

AATAGATACT GATGCAGCTC CTATTTACAA TAACCACGAA AACGAAAATT CTATGCCTAG 360 

CAAGCAAGTT AGTGTTAATC AAAAGCAAGA ACAAAAAAGA GAACAAAAAC AAGAAAAAAA 420 

TCAACTAAAC AACTTTAATA AAAACTTAAA ATCTGGCAAG GCTTATTGCT ATGAAATTTT 480 

TAGAGACGCA CTGTTTAATA TAAAAAATTG GGTAAATGAA GGTGAAGAAA AAAATAATAT 540 

AAATGCTCTT ATTCGGGCAT TATGTACTGA TAATGATGAT GCTTTAGAGG ATCTTTTTGA 600 

AAAGAATGCT GAGCTTAAGA ATATAGAATA TTGGGTAAAT ATTCTAAAAA AATATTTCAA 660 

TAAAACCnAT AGATTTGATG ATCTAAATAA GCTnAAAGTT TTTATGTCTG ATAATCGGGA 720 

TGTTTATAAA ACAAAAAnTA TT/^AAATTCT TTTGCATGTT AAAAAAAAAA AAGACAATTT 7 80 

AATTATATnT TTGCCAGTGT TGCCATATTA AAGCCCCCCA ATAAGGGGGC TGTTTAnATT 840 
(2) INFORMATION FOR SEQ ID NO: 108: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 814 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi ) SEQUENCE DESCRIPTION : SEQ ID NO : 108 : * 
GGCCGACTTT GTTTTATCTA CAATAACTTA TTTTAGTTTG AAAATTACAA GCAAGCCTGA 60 
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AACCATTCAT TATCCCTATG GACACAAACT AATGGAAAGC TTAATAGCTT TTATCATGGG 120 

AATAATTATA CTTATGACAG GATTTACACT ATTTCTAAAT ACAACCGGAT TAAATAAATT 180 

TATCACTCTT GGGGGAGAGT CTGGATTTAA TCTACACATA CACCAGAACA AAAATAAAAA 240 

TGATACTATA TATGAACATG ACCATTGCCA TTCACACGAT CACGATCACG ATCATAACCA 300 

CGACCACAAC GAAGAAGACA AAAAAAACAT ACTAGAAATA TTTTCAAATA AATGTCTAGA 360 

AGCAAAAGCA AGCTTTCGAT AAAACCCGAA. GTTGTTTCGC TAAAGTGACA AGGATTAAAC 420 

AGGATTGTAT TTTTCAGCAG CCTATTTTAT AAACGATCTG GATTTAGTAA ATAGTTTTTA 480 

GTTAGGAAAT AATGTAGGAT TACTAAGTGT GATGTCTGAG AGAAGGGACA AGTATTGTAG 540 

CGAGCTTAAA TCCTTATTAT CGTTGGCCAG TAATTTAGAG GTAGGGGATC GGGATAAAGG 600 

ATTGGCCAGT TTATAAGTTG GAGGGAAGGG CAAAGGATGC CTTAAAATCG GTAATCGCTC 660 

CTTAAGGTTT AGGGTTAACA AGTTTGGCCA CCAATTAACC TCCAAAAAAA GGCCAGGCAA 720 

AAATACCCAT TAAAGGCAGG ATTTCCGGTT TGGGAATTGG CCCCGGACCA CCTCCAAAAG 780 

GGCCATGGAA GGTTTGGGAA ATTGGTTAGG TAAA 814 
(2) INFORMATION FOR SEQ ID NO: 109: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 808 base pairs 

(B) TYPE: nucleic acid . 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 109: 
GGCAAAACCA GTTCTATTTT GTTCAAAATC AATATTCGAC, TCTTCAGAAT TTAGTTTTAA ^ 60 

ACTTTTGATT TCATATTTGT TTTCAAACTC TTCAGTTGAT TCAAATGCTA TTATCTTAGC 120 

TATAGGTACT TCTTGACCGA ATATTTTATA GTTATTGTCA TTAATGCTAT AATTAAGTAT 180 

AGCTAAAGGT AAGCAATGAA TAAGTTTTGA ATCGGATGGG TGAAAAAATA TAAGAATACT 240 

TAAGCTCTCT AAGATTTTCA ATTAAATTGT TATTTTTATC TTTTATATCT TTTAAATCAC 300 

CAGATTTTGC CCATGTAACA TAACCACTTG CAAGTATTTC AAATGCCTCT CCTTCTTTTA 360 

TTTCGTTTAA TTCGGGTTCC TTAAAGGTAA GACAAATATT GCTATTACTC TCTTCAATGG 420 

GCTTTTTATC ATATTTTATA ATATTTCCCT CTTCAATTAT CTTAAAATCC AAAACCTCGG 480 

TTTTGATACT GTTGATTTTT GAAGATTTTG GTGTAGTCAA AAAGCATGAA TAAAATAATG S4.0 

GTATATATAA AAATATATTC AAAATACATA TGTTCTTTTT CATAAAATTT TTCCATTAAT 600 
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TGTATTTCTT TCTATTTC 



660 



CATAAAACGA TCATACTCAG GGCTCCCCTC TTCGCCAGAA TACTTAATAT CTGGAGAATA 



720 



TAACTCGCTT ATACATGAAT ACAGCCAATA AACTTCACTT TTAAATTTAT TATTCTGCTC 



780 



ATTTTTTACC CTACCAAACA ACTTAATC 



808 



(2) INFORMATION FOR- SEQ ID NO: 110: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 804 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 110: 

TGGGAAACAT TATATCTAAC AACCCCTAGT GGTACTTTAC TTGAGGGGGA CATAGAAATT , 60 

GATGGCCTCA ATTCAACTGG ACAACGAAAA TCCTACAAAA TATCGCTAGG AAAAAGAAAA 120 

TATGTTTATA TGAAAGTAAA GTATAAACTT GACCTTAAAA ACTATCTCTA CTTAAACATA 180 

GACTCTCAAA TTAGAGACAT TTATTCTAGG ATTATTTCAA ATAACTATTC TGATATGGGA 240 

ATTAGCTTTG AATATCAAGA CTTTTTTGCT CCAGTTAATG AAGTTAAAGG AATTAAATTT 300 

ATGGAAATAA GTGCCTGTAT TAAAGACACA GACACTGAGA GTATTGCAAA AATTACTGAT 360 

AGCGATTTTA AAAAAAATCA AGATATTACT ATTACTGATG ATACAATGCT CCTTTTCAAT 420 

ACTACAGATA GATTGCTTAT TGATATTGAT AGTTAACAAA TATG/^AAATA CCTAATTTAT 480 

TCAATGGCAC TGAAGTTCAT AAATTJATAC TTACAGAAAC AGAATATGCA CAAGCATTGC 540 

TTAATGAACT CAAGTCTCTT AATTCTAACT TCCTATCCAT TAATGTAATA GAAAATATAA 600 

AATCAAGATA TATTGCAATA TGGATATCTC T^GTTTTATC TATCTTTTAT GCAAAAACTC 660 

AAACTTTACA AAGTATTACA AGCAATATTA ATAGCGTTAT TTTTGCTTTA CGCCATATTG 720 

GTACTGATGA GTCGTTTAGA CTAATTTTCA aGGCCTTTTa AATGTGGACA TGAAGTTACT 780 

ACTCCTGAAG CGGGGGTATG GAAA 804 
(2) INFORMATION FOR SEQ ID NO: 111: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 800 base pairs 

(B) TYPE: nucleic acid *" ' 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear \: 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 111: 
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GCGTGAGATG TTAATTTTTA CCnGCTTTAA AGCAGAATAG TCCATCCCCA TGAGGAGCAT 60 

AGCTTAAACT nCCCCTTAAG GTTTTTAAAA ATATCAAAAA CCTTnGTTTT TGTTCATCAA 120 

TTCCATCAAC AGTGATAAAC GTTATTAAAT ACCAATTCAA AATTATTGCC TAATCTTAAA 180 

yCCATACTAG TAATTATACC ATATTTAGCA AAAATTACTT AAACAAACTA TTAATATCAG 240 

AATTAATTTG AGCGGTTGCT ATTTTTAAGC TTGATTCGTC AATTACTGAG TCCCCTATAA 300 

TTTTTATACC ATTGATAGCA CTAACAATAT TATCTAGAAT TTTTTTTAAG CTAGTTGTTT 3 60 

GGTTTGCTAT TTCAATTTTA TTATTCGCTC TAATTTTAAC AGTATCAGAG ATTAGATTTA 420 

AAGTCTTTGG GCTAATTGCA CTAAGTATAT AAAAATGATG TTTGTCAAAG TGAATATCGT 480 

TATTTTTATC AAAAATATTA ATGCTTGATT GAAGTAGTAA AACGCAATCA CCTTTTGATA 540 

GTTCTAAACT GATATTAGAG ATATTTTTTG TGTGAATTTC TT^AATCTTCA AATTCGGGTA 600 

TTGTAACAAT AGCTTCTTGA GTTTGATGTT TAAACTCCTT TACAGTGCCA ATTTTAATTA 660 

TAAAAATGTT TGAATAAATC CAATTTTTAA GGTCTTCTTG AGCCT^TGCC TGGCCATAAA 720 

GGCGTTGATT CATTCtGTAA ATTTCATAGT CTTCaTTCaT TCtAATTCyA GTCCCCTTTA .7 80 

tTTTTTACgt TTTGTATTAG 800 

(2) INFORMATION FOR SEQ ID NO: 112: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi). SEQUENCE DESCRIPTION: SEQ ID NO: -112 : , /. 

GAAATAGCTT TTTAAGTTTT CTAAATCATC TTTAATATCA ATAACTTCTA TAAAGTATTA 60 

ATGATGAATT TTTGGGAATG TTTTATGGAT TTAAAAGATT AACAAGACCA CTTTTTTTAA 120 

ATACGAAGAT ATTATTACAA AAACTATCAA AACTGTACCC ATGTATAAAA TTCATTACAT 180 

AGAATTTAGA TTTAAGAAAG GAAGTGTTTT TTGTTATATA AAAGCAATTC ATGTTTTAAT 240 

AAAAAAAGAA AAATTTAAAA AAAATATGCT CAAAGTCTAT TAGAGAGAAT AATTT^TCTA 300 

GAACATAAAG TATTAAAGAT AAAGCAATTT TTTTAAAAAA TATATAAAAA TCGAAACAAA 360 

AAATTAAAGA TATAGTAAAA TTGTATTTGT AGCAATATAC TTGTGCTAGA GGCTATGAAT 420 

CTCTAAAGAT TTTAGCAGGG GAGAAAATAT GAAAAAAAGT TTTTTATCAA TATAckTGTT 480 

AATTTCAATA AGTTTATTAT CATGTGATGT TAGTAGATTA AATCAGAGAA ATATTAATGA 540 





600 



CGAATGTACA GGAGCATATA ATGATATTAT GACTTATTCG GAAGGTACAT TTTCTGATCA 



660 



AAGTAAGGTT AATCAAGCTA TATCTATATT TAAAAAAGAC AATAAAATTG TTAATAAGTT 



720 



TAAGGAGCTT GAAAAGATTA TAGAAGAATA CAAACCTATG TTTTTAAGTA AATTAATTGA 



780 



TGATTTTGCG GGATCCGT 



798 



(2) INFORMATION FOR SEQ ID NO: 113: 

{ i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 113: 

AGCTTTTGCA TAATAATTTT CATCAAATAA TTCCCATATT AAATCCTCCC AAATATCATT 60 

AATTTTTACT TACAGCTTTA TTTCCAAATA CTGCTACTTT TATTAAATAA ACATCGTTAC 120 

TAATTTGTTT TGCATCAGAC AACGCTATTG CATTAATAGT TGCCTTATTT GGTGGTGCTC 180 

CAGTCACCTT TTCAAGAGCA CCGTCTTTAT TAAAAACAAG TTTGTCTTTT ACTTTAAGCG 240 

TAGAATCTTT TGCTACTAAA TAACCCTCAA AATTATTTGT AATCGGAACA ATAGTGGCTG 300 

TTTTGCTAAA CTCATCTATA TCAATGCATA TTCCGTATAA ATCATCTTCA CCACCAGCCT 3 60 

CAACGTGGGG TTCATAGTGA ATTTGATCAG CTTTTTCCTC TTGAATAACT CTTTTTACCC 420 

CACGCTTATA TGGATACCCA GAAAATGGAT GATTTTCTAA TTTGTCAAAT TTGCTGGTTC 480 

TAGTGCCTCC AGAGGCAAAA AATTGTATGT TTTTATCTCT AAACTCTACA GAATTGCTAA 540 

GCAAACCAGC GTCATGCTGG GGATTTTTCA TAAACTTTTC AAGTTTACTT CTCTTCTCTT 600 

GaTAATCTTT TACTAATTGC GTTGTGTCTG cCATTTGTTT AACTCCTTTT ATTGcCCAAG 660 

GgCkAwCCrC CAGCTtCAGG TGTTACTGTT TTCTCAAGGG CCTCTATTGG CCAAAAATTG 720 

GCAAACTTTT TTTTTAAATT CCCAAAAAAA AATTTTTAAA AATTTAAAGG GAAAAATTTA 780 

AACCCTTTCC CCTTTTTG 798 
(2) INFORMATION FOR SEQ ID NO: 114: 

(i) SEQUENCE CHARACTERISTICS: .• *' * 

(A) LENGTH: 783 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 114: 

GGACTCAAAA CTTTACCCTT TAAATTACTA AATTTAACTT GAAAATACTA AACTTTAACC 60 

CAAAATAATA AAACTTTAAC TTGAATTTTT CAAAATTACA AAACTTTAAC CCAAAATGAT 120 

AAAACTTTAA TTTTTTGTAA TTTTTACATA AAAGTGTTAA CTTTAAAATC CCAAACTTTA 180 

TAATTTTGGG AAATTATCAA TACTTTTTTA ATTTATTCTT TATTTTCAAA ATAATCTTTA 240 

TATACTTATA TATTATGTAT AAGGCTATAA AAGAACAACA AGAAATAGAA ATAGATCATG 3 00 

CATGCAGAAT ACTTATTCTT ACCGCAACAA TATTTGAAAT AAATTCAATA TTCGAAAATT 3 60 

ATTATCAAAA AACTCTACTC AAAAAGTATA ACGAAAATCT CAAAAACAAA AATCTACCTC 420 

CTAGTAATAT ATCAACAATG AAAAAATACT TAAATCAATT AGAAAAAGAA ATAAAAATCA 480 

TAGCAAAATT CTATTTTAAA AACGATCAAT CTCTAATTTA TTGCAAACTT AATTATACCC 540 

TAGAAAAAAT TTGTTTAAAA CTAATAAAAT TCTACAAAAA ATTCTACAAA GAATTAAAAC 600 

AATTTACACA AAAGAACATT ACTACTTAAT TGTAAATACA TTATAAAATA ATCTTATGCA 660 

AATATTTAGA AATACAAATT GTAAAGATAT ATATTTTTAT TTAAATAAAT AATAAAAATT 720 

GCTGGCACAC TAATTTGGAA AAATCTTTAA AAGAnATACT AGGTATGAAT AGCnAAAATA 780 

AGC 783 
(2) INFORMATION FOR SEQ ID NO: 115: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 768 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 115: 

TTCTATATAA ATATTTTGTA ACTTTTTTGC TTATTACAGA CTAAGCCTAA ACGTCCTACA 60 

ACCCCATAAA TGCAACGCTC TGCAGCTTGA CACATTTAAA GTTTGGGCTA CTCCCTTTTC 120 

GCTCGCCACT ACTAAGGGAA TCTCTTTGAT TTCTTTTCCT CAGGGTACTT AGATGGTTCA 180 

CTTCCCCTGG TATCGCCTCT ATTATTTAAA TAATAGATAG CTAGCATCTT GCTAGCTGGA 240 

TTACTCCATT CGGT/^TCTT GGGATCAATA AATGTTTGCT TCTCCCCCAA GCTTTTCGCA 300 

GCTTACCACG ACCTTCTTCG CCTTAAAGCT CCTAGGCATT CACCATAGAC TCTTATTACT 360 

TTGACCATAT TTTTATCTTC CATCTCTATT TTGCCAATTT ATTTATACAA CATAAAATAA 4^0 

TATATATCTT TGTTTAATAC ATGTCAATAT ATATTTTATT TTTTATGTTA TTTAAACAAC 480 
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.^^TAAAAAACA TAAAAATAAA ATCAAAGTTT^KaG 



ACATTCAAAA ACACCAATAT^TAAAAAACA TAAAAATAAA ATCAAAGTTT AAAGTATAAA 540 

AATAAAAACC CTGGCAATAA CCTACTCTCC CGCGAACTCG CAGTACCATC AGCGAATAAG 600 

AGCTTAACTT CTGTGTTCGG AATGATAACA GGTGTTTCCT CTTTTCTTTA ACCACCAGGG - 660 

TTTTTACAAG GAAGACAAAA ATATgGcCAA AGATACGGGT AATTAGTATT AGTCAGCTTA 720 

ATATATTGCT ATACTTACAC TTCTAACCTA TCGACCTGGT ATTCTTTC 768 
(2) INFORMATION FOR SEQ ID NO: 116: • 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 765 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : doiible 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 116: 

CTTTACGCCT AACTTACCCT CCACGTGTAC AACCCCTTAA CAACCCCTTA ACTTACCAGT 60 

GACCCCCTTA ATATGGTAGT TATGGGGGAA CGCTTAGAAT AAAAAAGTCA TCTACGACAC 120 

CCCCGATCAT AGACCTGACT CTTGTTATCC CAAATCACTT CAGCGCCCTC GCAACTTATG 180 

GGAAAAAGTT CCTAGAAAGA TGTATAGAGA AGTGGAATCA AAGTAATAGG CAATTCGCAA 240 

GTGAATAAGG GAGAAAGGAT TTCCTATGTT ATAGGGAGAC GCTAGACATA GTGCTTGCGA 300 

GACTGGATTG TGCTTGATGG ATAGAACCTA GTTTAGTGTG TACATCCAAA AAATGGACTA 360 

AATCAATAGT ATAAGGCGAA TTGCCAGCGA TGAGGTCTGA ACCAAATTGC CTCACATCAG 420 

GCGATAACAG TTACTACTAA CAGTTGCCAC TTCGGCTACT CTATCTTGCG TGCTTATTGT 480 

AGCACTCTGG AGGTCCTGTT GTTAAGCCAG CATTAGCACA GCTCCTCCAC TGCGGGTTGC 540 

GAGTATAGAG TAGTCCTAAC TGGCAAGGAT TCCCCCTCTG GTTGCTAGAG GTCGAATTAC 600 

CCACCCAACA ATAGTTGCAT TGTTGGGGGG GTGGGTACCT ACTACTCGGC ATATACTCCC 660 

CCCCTTTCGA GACCTCCCTC GAGGGTCGAG GGAGCATTTG ATCATAGACG TTCATCCCAG 720 

ACATGGCCTT TCGGGTTTGA CGTCTCGCGA CCCCCCTTCG GGGAC 765 
(2) INFORMATION FOR SEQ ID NO: 117: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 755 base pairs 

(B) TYPE: nucleic- acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 117: 
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GAGCCATTAT TGGCTCCTAT TTTACTAGCT GCACTTGAAA TTCTTTTCTT TTTTAGGAAC 60 

AAATAACGCT CTTTAAATTA AAAGGCATAA TGCTATATTG TATTCTAAAT CATATACAAA 120 

GGACAGTTCT TTATATCATA AGTGCAAAAA TAAAGTCATA AATTCAATAA AAAGGAGGAA 180 

AACTCTTCTA GAGTAGTAGA AGAGCAACCA AAAATTAATG AAAATTTTTC TACACAAGAA 240 

TCTATACAAA AACTGCCCCT TTACTGCAAC ATACAAAACG TGAATCTTGT ATATTACAAT. 300 

AATAGATAAT ATTATTGCAA CAATCCTAAA TTACAAATAC AGAATATGTT ATTAGCCCCA 3 60 

AAAAGGGGCT AATACATTTA CTTTAAATTA CAAGTTATTC GAACCATAAT TGTTCAATAT 420 

TAATTTCAAA TCTTTTCTTA TAGCAAGAAA TTTTTCATAA ATCAATATTA GATAATCATC 480 

AAAATTGCTT TTATCAAGCA CATACAAAAG TTTAAAAAAA TCTACATCAT CAAGACATAA 540 

ATAGAATATG AAAACCTTAT TTTCAAACAC ATTATCAGCC AGCTTTACTT TAATTTTACG 600 

AAAAAGGTTG ATTAATTCTT TACSACTTTTT TGGCCCCAAA TTAAAAAAAA ATTCATTTAA 660 

AATGTTTTGA CTTTTAGGCG GAGACAATAT ATTTATTGTC TCCGCATCAT TTTCTATATC 720 

TAAGAATCGA CTCATAGGAA CTTATAAATG ACTTT 755 
(2) INFORMATION FOR SEQ ID NO: 118: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 753 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 118: 

.CTCAGCCAAG ATACTGGTTT GCTTAGTAAT TCTGTAGATT. TTAGAGATnA AAATCTAATT. 60 

TACTCCAATT CGGATGGAGT TTTTACTAGT AGTAAAGACA AAATAGAAAA TTATCCTGCT 120 

AAAGGGTATC CATACAAGCG TGGAGTCAAG CTTAGTTTTA GTGCAGATGG TACAACAGAA 180 

CTAGAAGTTG AGGCTGGTGG TGGGGATGAC TTGTACGGAA TATGCACTGA TATAGaTGAG 240 

TTTACTGGCA TGGCAACTGT AGTTCCAATT ACAAATAACT TCACGGGGTA TTTAACATTT 300 

AAGAAAAATG GAAATGGTGT AAACCCAGGT GATAAGCTGC ATTTTAATGC ACAAGGAGAG 360 

CTTGAAAAGA ATGGGGGAAA TGATAAATCT GTTAATGCTA TAGCACTTTC AAAAGTACAT 420 

AAATTAACCG AAGAGTTATC TATAGTGCTT GCTAGTGTTT TTGGGAATAG AGCTTTAAAA 480 

GGTAATTAAA TTATC3GCTTT AAAAGGCAAA GGGCAAGCTA AAGCTCCTAA TGTTGATGAT 54-0 

AATCCACAAT TAGGGCTAGA ATCAGAAATT CCAGTTGCTC CTAGATCTAA ACGTCAAACA 600 
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ft.^roCAAAAGAT CCTTATTTAG ATTCAGTTAA AGA 



AGACAGGCTG AAGAAGTACA TSGC AAAAGAT CCTTATTTAG ATTCAGTTAA AGAACTTGAC 660 

GATGTTCTTT TAAAATTTAA AAAATATTCA AAATCAATGA GTTCGATTGA AAATAAGGTT 720 

TTTAGTAGTT CGGGTGGTTG TTTTAAATCA AAG 753 
(2) INFORMATION FOR SEQ ID NO: 119: 

(x) SEQUENCE CHARACTERrSTICS : " 

(A) LENGTH: 747 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 119: 

TGATTTTAGC TGTTTTGTAA mCCAAAAGTG GATTATAATA ATTGfSGCCTA CTAGTCTGAA * 60 

TCCTAGAGTC AATAAAACTT ACACTAATTG TATCTTGCGG CAATTTCGTA TTCCTCCTTT 120 

AAAATTTCGA TTGCTTTTAC ACTAGCATTG AATGCTATAG ATGCACTGTA TGCATGGTTG 180 

CTATATTTTG TGCCTAAATT AATCAGTCCA ACTGTTTGCA TATTAGATGT TGGGTAAATG 240 

TAGAAGTTAA TTTTATTAAT ATATTCGGGT TGTAGACTGG GCAAAGTATA CTTATGAGCT 300 

TTATTGTGTA GAAAGTCACT AAGCATACTA TAAAGCATTA ACATGCGTGA ATTAGCrTCA 360 

AAGTCTTTGG CGTTTAACAC TATTGCAATA ATATATATTT GAAAATTTAT ACTAAATTCC 420 

AAAGCATTyT CAT7UVAATAC ACCkGCTyTA kAATTATGAT CAAATAGATT TTCTGTACCA 480 

GCAAATTTCA ATGCTATTAT ATTTGAGCTA GCAGCTGTGA TTTTTGAAAG ATATGGATGA 540 

TTGTAGGTAT TTATGATATC GCACTCAAAA TTATTTTCAG TTGCATACGC CTTAAACCCT ' 600 

TTAAATATTT TAGTTAAATG ATTTAATACC ATATCTAAAG TGAAAATCAT TCAAGTGTTA 660 

CCTTATAAGT. AATCTCTGAT AACATTTTGG CTGTATCAAC AAGTGGaATT GCTGCAGTGT 720 

TACTACCCCT TTTAAACTTA CTTTTGA .747 
(2) INFORMATION FOR SEQ ID NO: 120: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 744 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



V (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 120: 
ACACTTAATT CAAAAGTACT AAGCTTTAAC CCGGAAATCT TAAGAAGATT TGAGAATTGT 
AAATTTTAAC CTAAAAAGCA GAACCTCATA AAAGTTTGAC TTTTACCCAT AACAGTATAT 



60 



120 
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AATATTAATA TGTTTTTTTT CAAATTTTTT TCAAAACATA AACCTGCTAG GAAAAAAAAT 
TATCATAAAA TCAATCCGGA TGAATTCATT CTAATTAGCG AACATCTTAT CAATTCTTAC 
AGCATTACTC ACCAATTACT TGGGATTATC ATGGCCTCTG GAATTCCATT AACTCATATA 
AAAAAATCAA AACATCAAAA CTCCTTACAA TTTCAAATCT GATATATTTT CT'fATACGTT 
• GAACAACGGT TTGCAAATTC AAACACATTC. TCTAATTTGC TCTAACAAAA TTTCTAGGTG 
TATTGAAAGT TTAAACAAAA ACAGATTACT ATCTATTGGT GCAGACAAAA TTAATTATGT 
AGCAAAAAAT ATTTTTGATT TTAGAATTAC TACTAAACAA CTAAAAATTA TTCATTCTTT 
GATTGCTAGG TCAAAAGAAA CACTACATGA AATCAGATAT AACTCTCATT CACAAAACTT 
CTTTTTAGTT AAAACACCCT GTATTTTAAA TCTGTACCAA AAGCTCAAAT ATATCAAGTC 
ATTCGGCACC TCTAAAGCTC AATCAAAATA ATCTAAATTA TTATCGAAAC AGCTCCAATG 
AGCTTACATC TACTATTACA AATT 
(2) INFORMATION FOR SEQ ID NO: 121: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 721 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 121: 
AGTTTGTnTA TTCCTAGTAA CAATAACATT TCAGAATAAA GTTTTGTnAC CA/^AAGTTtT 
CTTCAGCcTC AACTTGTGTT TGTAAGTTTT TTTGTTCGCT CACCTCGATT TACCTTATGT 
TTTOAACOTT . GTTT^TATG TACTTGCAAA,,,AJ.AGTTTTTC. T TAACCCTCCT.. 
AAAACAAAAT CAATGTATGA ATGAGCAATA TCAGTTGAAT CTTTATCCAC TTGTTCATTT 
GGTGTAGGTA ACATATACTT GCTAGGTTTA AACTTAATAA GCTCTGGGTT TAATGGGTAA 
ATAAGTATTT GATGTTTTAG CAAGTTTGAA GTTTCAATGT AGACATCTTC TCTATTATTA 
ATAGCCyTGA TAGTTTGAAT CAAAACATCC TCCCATTTTT CGCAGCTACT TGCTGCACCC 
TGTGCTGCTG CGTATGGCTT TACGAGTTTG AGCGAaGTTG TAGGgTCAAC TATTACCATC 
ATAGGTGTAG AAAATtCGTC TCCTAGCTCT AACTTtGAAA GTCCCGCCTC AATTTTTtCA 
AATATTTTAT CCATTTTATC TTTATCACCA CTAGCAACTT CTTCTTTTAC TTGATGTGGC 
ATATTAAGAA GTCCATACAT ATTGGGAAGT AGACGTTTTT GATTTTTTCC ATCTTTTTGA 
ATTGAAACAG TGCCTGTTAG TACAAAGTGA TTAATAAGTT TAATAATCTC GCTACTTGCA 
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(2) INFORMATION FOR SEQ ID NO: 122: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 720 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 122: 

CAATTTCAGC TCTTAAATTT TCTATTTTAG TTCGCATACG AGTAAGTTCA ACACTAGAAT 60 

ATTGCTTAAA TGCACGTATA AATCCTAATT TTAAATTAGC ACACTCTATA TCTAATTCAC 120 

TTATAACTTT CCTAGCGTTA ACTTCTGATC TAAAGGTTTG CGATAAAAGG TGTTCTAAAG 180 

TATCTTCACT AATTGTTACT CTAGCGTCCT GGTTAACAAT ACTTTCTCCA CTTTCCCACT 240 

TTTGTCTCAT TCTCCACACA TTTACTTTAG AAACTCCTAA TTTTTTCGCT ATTTCTCTAT 300 

CATTTAACGA TCCTTCTCTA AAATACACAA CATAATCATC AAAAGGCCTT TTAACTTTTT 360 

TCAAAACAAT TTCTCCTAAA ATAACAAAAT TAACAAATTG TTACTCTAAG TAGTAAAGCA 420 

ATTTATTAAT TGTTAACATT AACTGATAAC TTCTTGATAT TTAGCGGGGA ATATTTGTTG 480 

GCCTTTATTG ATTTAGTTCG CTGCTATTTC TATAATTTTT GATTTAGAAA TAGTAGTTCA 540 

TTAATTTATT GCATATTACT ATi\AAATAAT TCTACTTTTT CGGAAAAATC TTTCATTTCA 600 

TTCATAAGAT TTTTACTTGT GAAAAGTCTT TTATCATAAT AGTGTATACT CAAAAATAAA 660 

ATATCTCTAA ATTCTTCAAT CGCATCtATT TGAAAGTCTA ATyCTAATAC TTTTCTCCTA 720 
(2) INFORMATION FOR SEQ ID NO: 123: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 123: 

TAATAAAAAA CTAAAGCTGT TCAACTGCAA TTGTTGCACT TGAAATTTTT TATACTAAAA • 60 

TAAAATACAA ATAATTATAT TAACAAATAT CGATTTTTAT AAAAAATAAG TAAAAGTAGT 120 

CTAGTTTACC TGAGTATTTA AATACTTTTA ATTGAGGATG TTTTATTTTA AAAAGGAGTG 180 

TAAAACTATG TCAAAAGCTG TTGACGAAGT ATATTGCTAT TCTTGTGGCA AGATTTAAAA 240 

AAGATGCTGA GATTTGTATT TCTTGCGGAG TCAGAAATAA ACAAACCGAA AACTACAATA 300 
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AACTTATAGT ATTTTTACTA TGCTTACTTT TTGGTTATTT AGGAGTTCAC AGATTTTATG 360 

TAGGTAAAAT AGG/^CTGGT CTATTATACC TATTTACATT TGGATTTTTA TATGTTGGAG 420 

TTTTAATCGA TCTTATTAGA ATAACAACAA ACAAGTTTAA ATGTAATTAA AAGGATTCTT 480 

TAGTAAATTT TTTATTAGTC TTGTTAAAAT TATTTTTTAA TTTTTTAAGC ACATTTTGTG 540 

TGAACTGCTA TTTCTATAAT CTTTGATTTA GAAATAGCAG TTCACTAGAT AATAATAAAG 600 

CTAAAATTAA TATyTtAGTA TTTAATAATT CTTGAgAAAA nGTAAAATTG GTATATGTTT 660 

ACTTGTTATA AAAAAATCTA TCTGGGTAGG ACTTTTAATG TTTAATAAAA TAGTG 715 

(2) INFORMATION FOR SEQ ID NO: 124: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 715 base pairs 
(B) TYPE: nucleic acid 
. (C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 124: 

GGAGGATTTA ATATGGAATT ATTTGATGAA AATTATTATG CAAAAGCTGT GGCAAATATC 60 

ATAGGAGAAG TTAAAGATCC TATTATGTAT AAATGGTTTT CGCCCGATCA AATTGAAGAT 12 0 

GTTGATCTAC AAATGGGATA TCAAAAAACC GTAAAATGGG ACGCGTTTTT AAATGCTAAT 180 

CCTACAACAA TTGCCAATGA GGTTAATACT ATCTCAACTA TTGGATTTAG TTCTGAAGTG 240 

GTAAGACTTA ATTATTTGAA ATTACAGTAT AAATTCAGAC ATTTAAAGCA GACTTCTGAG 300 

AAATTTTATA CTTCAGATTC ATATATTGGG GACATTAATA ATAATTTACT TCCTTTTGCT 3 60 
.CAAGCGTAT^^._AGCTTGCAAG TAGTGAAATT . ATTAAACTTA TTAATCAC.TT .TGTATT.AACC ,.,...420 

GGGACTGTTT CGATTCAAAA AGATGGGAAA AATCAAAAAC GCCTGCTTCC AAATATGTAT 480 

GGGCTGCTTA ATATGCCCGA GCAGATAAAA GAAGAGGTTG CTAGTGGTGA TAAAGATAAA 540 

ATGGATA7VAA TCTTTGAAAA GATTGAGGCT GGACTTTCAA AGTTAGAACT GGGCGACGAA 600 

TTTTCCACCC CGATGGATGG TAATAGTTGA CCCAGCAACG TCACTTAAAC TAGTAAAACC 660 

ATACGCnGCA GCACAGGGTG CAGCAAGTAG TTGTGAAAAA GGGAAGATGT TTTAA 715 
(2) INFORMATION FOR SEQ ID NO: 125: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 714 base pairs 

(B) TYPE: nucleic acid , . 

(C) STRANDEDNESS: doxoble 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 125: 

GTATAAAAAG CAAAAGAAAA ACATCTTCCT TCACAGAATA GTTGCCCAAA TCCAATAATA 60 

ATTCATACTG GTTGAAAAAT TTCCAAGAAA ACGCAAATTA TTATTGGTGT TCATATTGTT 120 

CAACATCTAG ACCAAACCGA AGTGGAGTGG CCTTTTTCTT ACTTCATTTA iSTAAGTTTTC 180 

AATAATTAAA CCAACAGGTA GTATTAAAAC AAAGTTTTAA TACTACCAAA GTTTTAATGG 240 

CTCCTTCAAA ACAGCAGTTT TAACCGTTTC ATTCTCTCTT CTGCTAATAG TAACTGGTCA 300 

TATTTAGTCA TTCCTCTCAA AACACCAATT GATGTAGCAA CAATTATCAA ATTACTAACA 360 

TTAAAAAACT AAAAATATTA TAAAATATCC AAAAATAAAA ATATTCTTAT TAATTAAATA 420 

ATTAATACTA ATTATTTAAT TATAGTATTA TTGCATTATA TTATAGTTAA GGAGAATATC 480 

TATGAAATAC CATATAATCG TAAGTATATT TGTOTTTCTA TTTTTAAATG CTTGCAATCC 540 

AGATTCTAAT. ACCAATCAAA ATAATTCTAA AAAGGAATTA AAAACAGGAA GAATCCCTAA 600 

TAAACAAATA .AAAAATGCCC TACTTGgATG ATTTAAAAAA TTTAATAGAA ACAGCTAGTG 660 

CAGGATAAAA AAATATGAAA AAAATTAGGA AGAAGAACCT TCAAACCAAT ATGG 714 
(2) INFORMATION FOR SEQ ID NO: 126: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 708 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) . SEQUENCE DESCRIPTION: SEQ ID NO: 126: 

GnATTAACTG GG7LAAAATTT CTCAAGTGTA ATTTTATATT CTTTTATATA ATTTTCATTT 60 

AAATCGAAAG TATCGTTCTA TGCTATCCCC TTGTTCAAGT CTTCACGTTC ATGAATGGGG 120 

CCTAAAAAAT TATCATCACC GCCTATTAAT TCCAATAAGT GTTTTCATTA CCAAAATTAC 180 

ATTTTTTGCA TATTTTTTAG TTTAAGTTTA TTAATTCTTT TTTTACTTTC GTTTTCTCTT 240 

TTTTATTTTT TATTTTTATA AATCACTTTT ATTTAAAATA TATGTATACA TATATTTTTT 300 

TTACTATCTC TTTTAATAAG CCCAGACAAA TAATTACAAA TATCACACAT TAAGCAACAC 360 

ACGTGCTCTT GCAATTTTGA TTTTTTAAGC CAATCTCCAA AAAATTTTTA AAAAACTTAT 420 

TATATTTATT GATTGCCCyT TAAGAAACTT TTTTTATTAT GCyTTTATTA TAACTTTGTA' 480 

AAyCTTtCAA TAGTTTAACT TAGATAGATC GGAAAATACC TTGnCTATTA GGGCTTTATT 540 

ATAACTGTTA AATTTTGnCn TTTTTTGTTA AAATTTATAT TGCCAATGAT AAAAATACGC 600 
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CAATTTAAAT TAAACATTTT AATAATGTCC AAATCCTCCT TATATAAGGC ACATCATAAA 660 
TCAATTTTAC TGAAAAAACA AAAAGCATAT CTAAGATTTC ACCCTATT 708 
(2) INFORMATION FOR SEQ ID NO: 127: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH:* 703 base pairs 

(B) TYPE: nucleic acid • . 

(C) . STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 127: 

GGCCAACATG AACTATAGCC TAAAAATCTA AAAGACTAAC TTGAATTTTC TAAAAATCGT 60 

AAATTTTAAC TCAAAAATCT AAACCTGCAA AATTTTAGAT TTATTACAAA GAAGTCTATC 120 

ATAAACTTCG TATAATCTTG TTTCAACTCT ATCTAATCTG GCTTTAAATT CATTACCAAA 180 

GCAACTAAAT CTTTAGTTTC AAATTCAAAT ACCACTCTTT TATCTAAATT ATCTATTTTA 240 

AAAACCTTTA GCAATATCTC AGTTCTTTTT TTCTACCTCA TTTTTTAGTT TAAAATTTTA 300 

TTTTTTATTT TTTTTATTAA CTTATTTATG ATAAAAAATT TTATTATTTA GTAAATAATT 360 

ATCATATCCT TTTATTAAAG AAGAAATATA ATCTTCTCCT TTTTTTTTAT TCTTTAATGC 420 

CTTAAAATCA CCAAGCAAGG TGATAAAATC TTCCTTAGCT AATGAGTAAA GACTAGCTAT 480 

AATAAAATTA. TTTTCATTTT CTTTTTCTTT AAAAAATTCA TCTTCTTTAT CTAGTTTCAG 540 

TATTTTATTA ACTTTTTCTT TATCAAACTT AAAATATTCT AAGTAAAGTA AATATTTAAA 600 

GTTTTCGGGA TCATTTTTGG CTATCAGTAA AGAAGTATTT TTTGCAAGAT TTAAATATAA 660 

AGGATTACTT AAAATTTCCT TTTCTTCGGG. TTGAGGCATT GGG ... 703 



(2) INFORMATION FOR SEQ ID NO: 128: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 699 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 128: 

CCGACTCAAA ACTTTACCCT TTAAATTGCT AACTTTAACT TGAAAATACT AAACTTTAAC 60 

CCGAAATGAT AAAACTTTAA TTTTTGCAAT TTTATTCTCT TGTTTTTTTT AAAACGATTX 12j0 

GAATAATCGT TGAkCAGGTT TATTGATTAT CAATAAACCT GATCTATAAT ATTATAAGCG 180 
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X^TOCTATAATA TCCATGAACA AATTATTGAT^OT'C 



GTTTTTGCAA GTTTAATAGG^TOCTATAATA TCCATGAACA AATTATTGAT ATfCATTATT 240 

TTATTAGTCT TTTCATGTAA TTTAAGTAAT TCTGATCAAA ATAATCCACT AAACATGTCA 300 

AATAAAGAAA AAATAAGCGA ATATCAAATA AATGAGTCGT CAAACAAATA TTCAATTTTC 360 

AAACGAAATT CAAGCGTTAA AAGATACACG TTCAACCATT ATTACTAACC AAAATGATAA 420 

TATTAATTGT ACTATTAACT ACCCACCTTA TATTCAAACT ATCTTAAAAA TAGAAAAACA 480 

AGTTGACGGA AATATTATTA TTAATGGGAT GACTAAAGAA AGTGGCACAG AAACTAAAAA 540 

GCTTTTAGAA ATTCCAAATG GGAATATTTC TCGACTTAAA GATGCAATTC AATATGGAGG 600 

AAGTTTTAGG GCTAAAGATG TTAGAGAAAA TCAAACCCAA AAAGAAAACA ACAAAGACTC 660 

GCATATTCAT GTCGaCAtTT TAAAGATACA TACTTTAAT 699 
(2) INFORMATION FOR SEQ ID NO: 129: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 695 base pairs. 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 129: 

GTGGCAAATA ATAATGTATT GTAAAATTTG ATTTTTTAAA ATGGTACATT ATAATATTGA 60 

TAAAGAGTAT TATCAATTAA CACTTAATTT TTGCTTTTTC ATAAATTAGA ACTTATTTGA 120 

ATTTTTTAAC AAGAGAATTT AAATAGGTTC TTTTATTTTA ACAAATACAA ATTGATTTTA 180 

ATTCTAAATT AGAATATATT CAATTATTGA AAAGCTTATT TAAATTATTT TAATAAGCAA 240 

ATTTGATTAA ACCCTAACTT TATTAAAATA ATTTATGTAA AAAGTTGTCA AAAATAGTTT 300 

TTGTTATACA TATATATATG TATGTAAATA GCTAAAAAAG TTTATTGCTA TCAAAACT^AT 360 

CCAATCAAGT TGGGTTTAGC TAAGTTCTTA GATAAGAGAA TTTAAATAAA CCCAACTATT 420 

TTTTTGTAAA ATTTTTTGTA AAAAAGCCTG ACAAAAATAG TTTTTGCTAT ATACTTATAT 480 

TTTTTACTAT AAAAGGAGTA AAAAGATGGA AAATCTTTCA AACAATAATA ATCCACAAGA 540 

AAATATTCAA GGAGAGCTCA AAATGATAAG TATTAATCAA CAAAGTTTTA " CTGGTTGTGA 600 

AATATTTGAG GAAAAATCTT CTCCCATTAA AGAAAAAAGT AAATTAAGTA AGATAGGTAA 660 

GAAATTACCA GGAATAAGTA GTCAAGAATG TTTTA '695 
(2) INFORMATION FOR SEQ ID NO: 130: V: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 684 base pairs 

(B) TYPE: nucleic acid 
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(C) STRANDEIMJEsS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 130: 

CAAGCAAGGG TTAACAACTA CCTTAAAGAC AAATTTAATA AAAAAGGGAA TCTAAATTTA 60 

GAGGAGTGTA ATAATAATAA TAATAATAAA GAAGAAGAAG AAGAAGACAT AAGAAATAAT 120 

AAAATAGAAA AATGTCAAAT AAAAAAATAT TTCAACAAAT GTAACTTTTT ATCCGAAGAA 180 

GCTAAGTCCA TTTTAGAATT AAACATTAGT AAGAATAAAA CAATTGAAAT AATAAAAATA 240 

ATAAAAAAAA TTGAAACCGA CTTAACAAAA AATAAAAACA AAGTTTGTTT TAAGAAAAAG 300 

CAAAAAATGT TGAAAGAAAT ACTAAGCAAA ACTAAAAAGC AATTAGAAAA AAAAGGATAT 360 

GACACCAAAC AACTGAAACT CAAAATCGAA AACATATATA AAAGTTATAA AACCTU^GCCC 420 

CATTTTATTA TTGAAAATAA AAAATACAAA GACCTAGACA AAATAAGGCT TAAACTAGAA 480 

AAATCAATTG AAATTAAAAA AGAAAGTATT ACAAAAAAAT ATATACATAT AAAAGTAAAT 540 

ATTTTCAACA TACTAATAGA ACAATTGAAA AAAGrmTTGG rAATAAAAAC TTTAAAGCCA 600 

ATTATAAAAA ATTATCTAAA TAGCnAAAAA ACCCTAGAAT ATGATAAAGT GTTCAATACC 660 

TATTATTATG nACTATTAGA AACT 684 
(2) INFORMATION FOR SEQ ID NO: 131: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 673 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 131: 

GTATAAATTA TCTTTTAAAT TTATTACTAA ATCTCAAATT AGATATATAC TTTGTGTTTG 60 

TGCATAAACC AACTCCAGCT TTAAACAGAT CACAAGCGCT AAAGAACTTA CTAATCTACT 120 

TGCAACAAAC ACCAAAACTT TGAAATAAGA AATTCAGTCA ACCTTAATAG CAAATCAAGA 180 

AAAACCAAAT CTAGATATTG ATAATTGACG TACAAAAAGA AATAGACAAC ATAATTTCAA 240 

ATCTAAAAGA GTTTATTAAA ACTCTACAAA CCCTACATTA AAATCTGCTT AGCATAGCTA 300 

AGTATGCTCA ACAACATCTT AAAAAATTCA ATTCCAAAAA TAAAATCTAA AAATTGCACT 360 

ATTATTTAAA TATCAAAACT TAATTATTAG GAGGTAATAT TAATATGAAA AAAATTCTTCA 42jQ.. 

CATTAATATT AATTTTTAGT TTAACGATGC AAATCTTTGC TTTAAATTTC ACTTCAAAAT 480 
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ATAAAATTCA GAAATATGCT 




1101 \ 
lGAGAAA AGGAGTTCAT TCAAAACCAG 



lTTAGAAA 



540 



AAATTTTGAA AGACCCCGAA AAGACTAAAA AGGCTCTTTT GCAATACGAA AAAGAACAAT 



600 



TGATAGATCT ATGGATTCCA GTAATGTTAA ATTTATTTTT ACCTTTTGGA GTGGGGcTTT 



660 



TGTCCAGGAG ATT 



673 



(2) INFORMATION FOR SEQ ID NO: 132: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 660 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 132: 

CGAGTATTTT GACTCAAAAC TTTACCCTTT AAATTGCTAA CTTTAACTTG AAAATACTAA 60 

ACTTTAACCC GAAATAATAA AACTTTAACT AGAATTTTTC AAAATGATAA AACTTTAACC 120 

CGAAATGATA AAACTTTAAT TTTTGCAATT TTATTCTCTT GTTTTTTTTA AAACGATTAG 180 

AATAATCGTT GAkCAGGTTT ATTGATTATC AATAAACCTG ATCTATAATA TTATAAGCGG 240 

TTTTTGCAAG TTTAATAGGA GCTATAATAT CCATGAACAA ATTATTGATA TTCATTATTT 300 

TATTAGTCTT TTCATGTAAT TTAAGTAATT CTGATCAAAA TAATCCACTA AACATGTCAA 360 

ATAAAGAAAA AATAAGCGAA TATCAAATAA ATGAGTCGTC AAACAAATAT TCAATTTTCA 420 

AACGAAATTC AAGCGTTAAA AGATACACGT TCAACCATTA TTACTAACCA AAATGATAAT 480 

ATTAATTCTA, CTATTAACTA CCCACCTTAT ATTCAAACTA TCTTAAAAAT AGAAAAACAA 540 

GTTGACGGAA ATATTAATGG GATGACTAAA GAAAGTGGCA CAGAAACTAA AAAGCTTTTA 600 

GAAATTCTAA ATGGGrATAT TTCTCGATTT AAAGATGaAT TCAATATGGA GGTAGTTTTA 660 
(2) INFORMATION FOR SEQ ID NO: 133: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 656 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION:-- SEQ ID NO: 133: 

AGCACTTTAA AGAAAAAAAA GAAGAAAQAT ACCAAAATAG AGTTGCCAAC TATTTCAACA 60 

AAAATTCTGA TTCAAAAATG GGTAGTGTGC AATTGGGGGA GTGTAATAAT AATAATAATA 12 0 

ATATAAAAGA AGAAAGAAAA ATTAACGAAA TAGAAAAGTA TCAAGTAATA AAATACTTCA 180 
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ACAAGTGTGA CTTTTCATGT AAAGAAATTC TTCCAGTTTT ATTAACATTA AATATTGATA 240 

AAGAAAACAT AATTAAAATA ATAAAAATCC TAAAAATAAC CGAAATTAAC TCAAAAAATA 300 

AAAATATACG CCCTACTAAA TCTTGTATTA AAAAAAAACA AGAAAAATTA AAGGGAATTC 3 60 

TATGTAACAC TCAAAAAGAA TTAGAAGAAA ACGGGTACAA TCCCAAACAA TTAGAAATAA 420 

ATTTTCAAAA AATATACGAA AATTACAAAT ATAAACCCCA TTTTATTATT GAAAATCATA 480 

AATATAGCGA TTTAAACAAC ATAAAACGTA AATTGGAAAA GTCAtTGAAA GAAAAAAAGA 540 

AATTCTCAAC AAGATTATGA aATTTAAAGA TAAACGTTTT CAATATCCTA TTGAACAACT 600 

AAAAAAAGAA ACAATATTGA nTTCTAAAGC CCTTATAAAA GAATTTTGAA TACCAn 656 
(2) INFORMATION FOR SEQ. ID NO: 134: 

(i) SEQUENCE CHARACTERISTICS: 

(A) .-LENGTH: 652 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 134: 

TGnAATTAAT GTATCAAGCG ACTCTTTGTA TCCAGTACTT TTACTGTAAA ATGTAGTCCT 60 

AACAACAGGA ACTTCACCAT TTTTACCATA CACAAAAGTT GGAAATTGCC AAAAACCAAG 12 0 

CTTTAAATTG TGATTTTTTA TAACATTTTG AATTACTTCT ACTATGACAT TGAAATCTTG 180 

ATACTTATAT CCGTATCCTT TAAGACTTTT GTCAATACGT GGCAAGTTCA TTCTTAAAGT 240 

ATCCATATCA TTTAAAAAGT CTATTTCTGC TTGAATATTA TTTTGTATTT CTTGATTATT 3 00 
ATTGTTTGAA ACATTGTTCA TCTTTTCCTC . CTTTATTTAG, TAATAAATAA GTATATAQCA . . 360 

AAAACTATTT TTGTCAGGCT TTTtACAAAA ATTTTTACAA AAAAGAAGTG GGACTtAACC 420 

AAACTCTTTT CTTAAAGAAT CTCGTTAAGT CCCCACTATA TTATTATTTT TTGCAAATTA 480 

CTAAATAAAG GTAGTCAAAC TGAAATATGT TCAAATAACT ACGCTGTTTG TAGTGTAGCC 540 

CAATTTTTAA TTAAAATCAA TCAATCTTTT ACTAAGTTAT AAAAAGTATA TTAATTTAAC 600 

AAAATTAATA ATTAAAATTT AATATTTTTT TAGAAAAGTA TTTAnCTTTA AA 652 



(2) INFORMATION FOR SEQ ID NO: 135: 

( i ) SEQUENCE VCHARACTERI STICS : 

(A) LENGTH: 649 base pairs 

(B) TYPE:"- nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 135: 

nAATTCGAGC TCGCGTACCC AGAAAGTTCA GTTAACAAAA TGTAGTCATG ACTACCTAGT 60 

GTCACTTCAA TGTTGAAAAC ATAAGTTATT GTTTTGGGAT CTCTTAAGCT TATTACAGGC 120 

ATACCTTTAT CTTCACTACT AATCACTGCT CTTGTTGTAG GTTCGCTTGT AAGCTCTAGC 180 

TTGCCACTAT GTAACTGCGT ACCACCAATT GAAAAATAAA CTTCTCTTAA ATCATAAAAT 240 

TGCATTTTTA GACCCCCTTT TAAGCACTTA AGCTGTTTTG ATAATCAAcT ATATCTTGAG 300 

TAGTAATTAC TAAAGCAACA GCATTAATGC TAAAGTTATA AGTAATAkTC ACGCyAAGTT 360 

CTAATTTAAG TTGyGGkGTA GGAGAAAGAG TAAGAyTTAA ATTTTTrTAC TCwATwATCA 420 

GTCCTCTATC CACAAACCTT TTCAGTAAAC ATTCAATTGC TGAAGTATAT GCATTGTCTC 480 

TAGCTCCACT AAGCTGCAGT GCAGATAATT TGCTATTTTG CCTATTQTTT TTGTTCCAAA 540 

TTyTAATAAG CTCAATAATC GCTTCGTTTT TTATATAGTG GTATGTAAAT TGTTCGTCTA 600 

TTGyACyTCC AGCTAGGTCA ACACCTTCTT TAAAGGCAGG TAAACCATC 649 
(2) INFORMATION FOR SEQ ID NO: 136:. 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 136: 

TAAGCAAAAG GnCCTAATGT TCAnGATAAT CCACAATTAG GGTTAGAATC AGAAATTCCA 60 

GTTGCTCCTA GATCTAAACG TCAAGCAAGA CAGGCTGAAG AAGCACAAGC AAAAGATCCT 120 

TATTTAGATT CAGTTAAAGA ACTTGACGAT GTTCTTTTAA AATTTAAAAA ATATTCAAAA 180 

TCAATGAGTT CGATTGAAAA TAAGGTTTTT AGTAGTTCGG GtGGTTGTTT TAAATCAAAG 240 

AATGtaiGCGAG TTAATGCTTA TTCTTTTACA TrTTCAAGCT TTGCAGACAA AATAGAAGAA 300 

TACCTTTATG ATCCAGCAAA TAGTTTTCCA TATAAGCGTG GGGTTAAACT TGTTCCAAAA 3,60 

GAGAAyTCTA TATATGTTGA AGTTGGTGCT GATACTGATA TGTATGGGAT ATGTGTAGAT 420 

GTATGTQAGT TTAGTAGTAC TGCGTATGTA TTACCAATTA CGAATAACTT TGAAGGGTwT 480 

CTTGTT^CAA GAAATCCGAG TATAAAAATG GGaGAAATAT kGGaTATAAA TAACAATGGG 540 

GTTATaTCAA GGCTGGTGGT GGGCCmCCAA cCGyAATTAa TGCATATGCC CTCTCTGaTT 600 

CATTACAATC AATTTTGGCA CCCGAAGATG AAGATC/^GA TCAG 644 
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(2) INFORMATION FOR SEQ ID NO: 137: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 636 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 137: 

AAAAAGTAAT GAATCATGCA TGCAGATTAC TTATTCTTAC CATAACAATA TTTGAAATCA 60 

ATTTAATATT AGAAAATTAT TCTCAAAAAA CTCTACTCAA ATTTTATAAC GAAAATCTCA 120 

AAAACCGAAA TCTAACTCCT AGTGTTATAT CAACAATAGA AAAATACTTA AACCAATTAG 180 

AAAAAGAAAT AAACGTCATA GTCGAATTCT ATTTTAAAGA CAATCAATCC ATAATTTATT 240 

ATAAACTTAA TTACACCCTA GAAAAAGTTT GCTTAAAACT ACAAGAATAC TACAAATTAT 3 00 

TCTACAAAAA ATTAAAACAA TTTTTACAAA AAAACACTAC TACTACTTAA TTGTAAAAAA 360 

TTATATCTTT GCAAATTAAG CAAATTTAGA AATATAAATT GCAAAGATAT ATATTTTTAT 420 

ATGATAAATA ATAAAAATTA CTAGGAATAC TAACTTGGAA AAACTTTTGA AAAAAATAAT 480 

AAAAATGAAT TACAAAAATA AGCTATCTTC TCACTTAATA ATTCTTATTT ACACACTAGG 540 

CGACACTGAA CTAAATTTAA ATATTGAGTA CTATAGTAGG GGCTTTATAC ACCACGTGTT 600 

TAATTCTAAC ATACATAAAT ATTGCAATAC TACTGA 636 

(2) INFORMATION FOR SEQ ID NO: 138: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 632 base pairs 
JB) TYPE: nucleic acid 

(C) STRANDEDNESS: douijle 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: ,SEQ ID NO: 138: 

CCAATAACAT GACTTTAAAG GTTGCTTATT GACAATATGT TATTTTTCAA CTTTGTTGCT . 60 

TGAGAACTTT TTTTTTCAAT TTGCTTGTAA AGTTCCGTTA AATGAGATTC AAGCTTAGCA 120 

ATATCTGTTT TTATAGAATC CTTATCATCT TGATAATCTA ATAAAAGTTG GTTTAACATG 180 

TCTGATACGA TTGATTTCAT GGATAATAAT TTTTCAAACG AATTTTTAAG CTTCTCTAAA 240 

. TTTGAAATTT CTAGTTTATC TAAAGCATCC TTTTTAGGAT ATAAGTGATT AATCGCTGTA 3aQ. 

TCAAAAGTTC TTCCAAGGTT GCAAAAAGTG CCAAATAGGA GGGTTTTTTG TTTTGATTGA 360 
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ATTAAAATCT TTGAAAGATT OTCTAACTTA TTGGTATTAA TAGGATTTAA AGTAGCATAA 420 

GTGAATTTTC TATAGTTTTT AGATCTATCG GTATTATCTG CTACCGTTTC ATATGATGCT 480 

ACCCAATAAA TTTCTTTGAA AATTGATATT CCATATTGGT TTGAAGGTTC TTCTTCTAAT 540 

TTTTTTTCAT ATTTTTTTCT ATCCTCGTTA GCTGTTTCTA TTAAATTTTT TAAATCATCA 600 

AGTAGCTTAT TTTTTATTTG TTTATTAGGG AT . 632 
(2) INFORMATION FOR SEQ ID NO: 139: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 628 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 139: 

GACTTCTTTA ATAGATCAAA AAGCTCACTT CCATCACCCC CAAGAACACT ATTAACAGCG 60 

GGGATCCTCT AGAGTCGACC TGCAGGCATG CAAGCTTGGC ACTGGCCGTC GTTTTACAAC 120 

GTCGTGACTG GGAAAACCCT GGCGTTACCC AACTTAtCGC CTTGCAGCAC ATCCCCCTTT 180 

CGCCAGCTGG CGTAATAGCG AAGAGGCCCG CACCGATCGC CCTTCCCAAC AGTTGCGCAn 240 

CTGAATGGCG AATGGCGCCT GATGCGGTAT TTTCTCCTTA CGCATCTGTG CGGTATTTCA 300 

CACCGCATAT GGTGCACTCT CAGTACAATC TGCTCTGATG CCGCATAGTT AAGCCAGCCC 360 

CGACACCCGC CAACACCCGC TGACGCGCCC TGACGGGCTT GTCTGCTCCC GGCATCCGCT 420 

TACAGACAAG CTGTGACCGT CTCCGGGAGC TGCATGTGTC AGAGGTTTTC ACCGTCATCA 480 

CCGAAACGCG CGAGAcGAAA GGGGCCTCGT GgATACGCCT AwTTTTATAG GkTAATGTCA 540 

TGaTAAtAAT GGtTTCTTAg AACGTcAGGg GGCAyTTTTC GGGGGAAAAG TGCGGGGGAA 600 

CCCTAATTGG TTAATTTTTC CAAAATAC 628 
(2) INFORMATION FOR SEQ ID NO: 140: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 621 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 140: 
ATACCGCTAA ACTCATCTAT ATCGGAACAC ACTCCATATA AATCGTCTCC ACCACCAGCC 
TCAACTTCTA GTTCGGTTGT TCCATCTCCA AAACTAAGCT TAACACCCCG TTTATACGGA 



60 



120 
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TACCCTTTAG CnGGtAATTC TCTATTTTGT CTTTACTGCT AGTGCAAACC CCACCAGAAT 180 

TGGAAAAAAT TAGATTTtGG TCTCTAAAAT CAATAGAATT GCTAAGCAAT CCTGAGTCTT 240 

GTTGGGGATT TTTCATTAAT GCTTGAATTT CTGCAACTTT CTTATCAAAT TCTTGTTTAA 300 

TTTTTGTTAT ATCACTCATT TAAAAACTCC TTTAGGCAAT ACTTGTTCTT TTATGTCTTT 360 

TTAGATTTTC ATAAAATTGA ATTCGTCTTT GCTTGTATGT ATTACTTATC GCTTGTACAA 420 

ATTCTGTGAA ATTAATAGGT ACAAAATTAG AATCAAGCAA ACTTGCTCTT TCTTCTGATT 480 

TAATAGCAAT ATTCCCCTTA ATAGAGTCAA CAGAAGAAGA ACTGCTACTC GCATTTTTTC 54 0 

TTAATTTAAT ATTCACTTTT GCTAAAGAAA CAAGTTGCTC TAATATCTCT CCATCGATAT 600 

GACTTATGTC TGATACTTTG G 621 
(2) INFORMATION FOR SEQ ID NO: 141: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 608 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 141: 

TCCAACTAAT AGTTATTGAT TTGTTCTTGT AGTCAGACGA TAAGCGTTGG TCCGTATGCA 60 

AAATTtCTTC CATGTGAAAA ATCTGATGGT GCTCCAAGCA GTTGTTTTGG AACGGGTGTT 120 

TTTTGAATAC TTGAAGAAGA CATTATCAAA A6ATCATCAT TTCTAGATAG AGTGGCTGAT 180 

GATATGCTAT TTGTAAGGCG TGATTTAATT TTACTAAAAA GGTTAGAAAT ATTAGTAGAA 240 

TCGTTGTTAA TTAATITTGTC . CGTTATTTTA GCATAAATTG TTTCTACAAA ATCTGTATTG 300. 

GCTGCAAGTT CTTCGGCAAT TGTAGACTTA ATTATCTGCT TAAAATAGTC TAATCCTTCT 360 

CCTTTAAATA TTTTGTCTTT AGAAGCATCT AAAAAGTTTT TAAAGGTGAT AGCATTACTG 420 

CTTGCAGCTC CATCATCAAG CAGTAAAAGA TCAGTATTGT TAACGGTCGT AACCTTATTT 480 

AAATCTTTTA TTTGAACCGT TTCTTCTTCA TCAATTAGTA ATTTTTCTTG ATCATCAGCC 540 

ATAAAACCTC CTTAGTTGTT AAAAGTTATA ATATTGTTAC CATCTGTATT ATTAATTTTG 600 

AGAACTCT 608 
(2) INFORMATION FOR SEQ ID NO: 142: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 591 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 142: 

CTCCAATAGC GCTAAAAGAA TTAAATATAC TTGCTACTGA TGCTAGTTTA TTTATATCTT 60 

GAATAATATT TGCGAATTCC TTTAATTGAT GAGGATCCAG GGGGCTTAAA ACAGTATAAG 120 

TGTGTCTTCT ATATCTTATA GATCTTTCGG TATTGTCAGA TATATCTTCA GTCCCTGGCC 180 

CCCAATTCAA TCCCCTAAAA GACGTCATCC CGTAATGGTC TTCAGGTTCT TTTTCCATAC 240 

TTTTTACATA TTTTTCTTTA AAATTGTAGG CCGATTCTAT TTGCTTTTTT AAATCATTAG 300 

ATAGCGTATT TTTTAGTTGT TGTTTTCTTA GTTCTTCCTT CTCTTCTTCT TGTTGTTTTT 360 

TCTTAAGCTC TTCTTCTTGT TGTTTTTTCT TAAGCTCTTG TTCTTGTTGT TTTTTCTTAA 420 

GCTCTTCTTC TTGTTGTTTT TTCTTAAGCT CTTCTTCTTG TTGTTTTTTC TTAAGCTCTT 480 

CTTCTTGTTG TTTTTTCTTA AGCTCTTCTT CTTGTTGTTT TTTCTTAAGC TCTTCTTCTT 540 

GTTGTTTTTT CTTAAGCTCT TCTTCTTGTT GTTTTTTCTT AAGCTCTTCT T 591 



(2) INFORMATION FOR SEQ ID NO: 143: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 586 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 143: 

GTGTTAGTGT CCCCATGTGA ATGGGTGCAC TAAAAAATTA AAAAAATAAA TTTAATATAG 60 

GAGGATTAAT TAATGCTTAT TAATAAAATA AAACAAGATA ATAGAACTTT AAGACCGGAG 120 

ATACAAAAAT GGGGTTGTTa CTTTTTGTGT CTGCATTATT ATACAAGTCT ATTTAAGCAA 180 

CGTGAATTTA ATGCATATGA AATAAATACA GCGTATTATA GATTTATAGG ACTTGGTTAT 240 

ATCAAGAGCA ATTGTTTTAT TATAAATCCA TGTATGATAC TTAATTATTA CGGAATTAGA 300 

AGTAGCGTGA GATATGAAAC TGCAAATTAT TTGGGTGCAG CAAATGAATT TGAAATAAGT 360 

GAAGTTAAAA TCGATAAGGk TAATGGATAT CACTTTATAT CAACAAAAAA TAAAGAAATA 420 

TTATATGATT CACTTGaTTT AAAGCCACGT GGAAAAATAT TTAAAGTAAC TTCmAAACGT 480 

wTwTTTAAAC tGrAATAGTT TaCTAAgTTT AAGGCACTTT TaGCACATTC ATAgCTgAAT 540 

TTaTTAGCAG rAGrTAGGcC GTAGGATATA ACCAATTTCA TTGGTT 586 
(2) INFORMATION FOR SEQ ID NO: 144: 
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I i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 585 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 144: 

GTGTTTTTTA GCAATTTATT TTCAACTCTT TTTATGTTTT TGATTATTTT AATCATAGTA 60 

TCTTTATCAA CATTTAATGT TAATAAAAAT GGAAGAATTT CTTTACATAA GAAGTTACTT 120 

TTGTTGAAGT ACTTTATTAC TTGATATTTT TCTATTTCGT TAATCTTTCT TTCTTCTTTT 180 

ATATTATTTT TATTACTTAA, ACACTCCACT GAATTTACAC TACTATTTTT GGAAACATTG 240 

TCTTTAAAAT GkTTATTAAC TCTAGATTTA AATCTAGAGT TTTTTyGyTC TTTAAAGTAC 300 

TTGTTGATTT TGTGGTAACA yTCTTTTTTA GGATACTTTA GCTTATAGTA AATTTCAGTT 360 

CCACAATTTA CACCCATrTG TTGGTAGTAA TTAGTTGTrA CTTTTAATAC TTTTTCTAAT 420 

TtGTAAAGAT AATTTtGCAT tGTTCTtAGw GTAGTGGGAG CTAGACCAkT CcTTTTtAGA 480 

TTTtCryTAw AGyArTAGAG TATGTTTTGT TGCGTGTATT TCTTATCTTT TTTGGTTAGG 540 

TAATCTAGCG TTGAAGTAAG AGAGATTAAT TTGTGTTGGT GTTTG 585 
(2) INFORMATION FOR SEQ ID NO: 145: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 575 base pairs 

(B) TYPE: nucleic, acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 145: 

GGGAGATTTA ATATGGAATT ATTTGATGAA AATTATTATG CAAAAGCTGT GGCAAATATC 60 

ATAGGAGAAG TTAAAGATCC TATTATGTAT AAATGGTTTT CGCCCGATCA AATTGAAGAT 120 

GTTGATCTAC AAATGGGATA TCAAAAAACC GTAAAATGGG ACGCGTTTTT AAATGCTAAT 180 

CCTACAACAA TTGCCAATGA GGTTAATACT ATCTCAACTA TTGGATTTAG TTCTGAAGTG 240 

GTAAGACTTA ATTATTTGAA ATTACAGTAT AAATTCAGAC ATTTAAAGCA GACTTCTGAG 300 

AAATTTTATA CTTCAGATTC ATATATTGGG GACATTAATA ATAATTTACT tCCTTTkGCT 360 

CAAGCGTATA AGCTTGCAAG TAGTGAAATT ATTAAACTTA TTAATCACTT TGTATTAACC 4Z0. 

GGGACTGTTT CGATTCAAAA AGATGGGAAA AATCAAAAAC GCCTGCTTCC AAATATGTAG 480 
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GGTAAAATCT TGAAAAGATG AGGCGGACTT CAAGT 



575 



(2) INFORMATION FOR SEQ ID NO: 146: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 571 base pairs 
,(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 146: 

TTGGTTCCCA nCnTATTTCG TTGAAATTGT GATACTTATA GCCATAACCT TTAAGATTTT 60 

TATCAATCCC CGGCAAGTTC ATCCTTAGGG TTTTCATATC TCTTAAAAAG TCAATTTCTG 120 

CTTGATTAAT TTCTTGTGGA TTATTGTTTT TGCGGTTTTT CATTTTTTTA CTCCGTAAGT 180 

TATAATTTTC TTATATATAA ATATATAGCA AAAACTATTT TTGTCAACTT TTTTTAATAA 240 

AAATTTTTGT TAAAAGACTT AGGGCTTTGC TAAATTCTCT TTTAAAAGAA CTTAGTAAAG 300 

CCCT7VATATT TTTACGATCC AATATTCAAG TAGGAAATAA TGAAAAATTA TTTCCTACAA 3 60 

AACTATATTT AGTTTAGTTC AACCTTAAAT TAAAATCAAT TAATATTATT ACACTGCGGT 420 

CTATAAAAAT ACAAAAATAT AAAGCTTTTA T/^AAATCTTA TTTTAAAAGA ACTTATAAAA 480 

ACCTATTCTC TAAATTATTT ACAAAATTCT AAAATTAGAT TTTTAGTTCT TCATATTTCC 540 

TTAAAAGTTT TTTAAGAAAA TCTTTTTGAT T 571 
(2) INFORMATION FOR SEQ ID NO: 147: 

(i) SEQUENCE CHARACTERISTICS: . 

(A) LENGTH: -555 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

»■ 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 147: 
AAGCGTATAA GCTTGCAAGT AGTGAAATTA TTAAACTTAT TAATCACTTT GTATTAACCG 60 
GGACTGTTTC GATTCAAAAA GATGGGAAAA ATCAAAAACG CCTGCTTCCA AATATGTATG 120 
GGCTGCTTAA TATGCCCGAG CAGATAAAAG AAGAGGTTGC TAGTGGTGAT AAAGATAAAA 180 
TGGATAAAAT CTTTGAAAAG ATTGAGGCTG GACTTTCAAA GTTAGAACTG dSCGACGAAT 240 
TTTCCACCCC GATGATGGTA ATAGTTGACC CAGCAACGTC ACTTAAACTA GTAAAACCAT 3 00 

ACGCAGCAGC ACAGGGTGCA GCAAGTAGTT GTGAAAAATG GGAAGATGTT TTAATTCAAA 360 
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CTATTAAGGC TATTAATAAT AGAGAAGATG TTTACATTGA AACTTCAAAC TTGCTGAAAC 420 

ATAAAATACT CATTTATCCA GTAAATTCTG AACTTATTAA ATTTAAACCT AGCAAGTATA 480 

TGCTACCTAC ACCGAATGAA CAAGTTGATA AAGACTCAAC CGATGTAGCT CTTCTACATT 540 

•GATTTTGTTT TGGGC 555 
{2) INFORMATION FOR SEQ ID NO: 148: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 549 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 148: 

GTTTCTTCTT GGAGAATTTT GATTTGAAGA TTTTGAATTT TGAGATTCAT TTTCAAGATT 60 

TTGGTTATTT TCTGATGGAT TTTTTGTTGA ATTTCCTGTT AAATTTTCTG AATTGGTGTG 120 

ATTGCTTGTG TTTTTTAGAT TTCTAGAATT GTTGCTTCGT TTTGTTTTTT TTAGACTTTT 180 

AGAAGTGGTA GGATTTTTTG GTTCGTTTGG GTTAACATTG CCAAAAGGTG CACATGATAT 240 

GCAAATTGAA GTTAATATTG CTGTAATAAC GTTAAGTTTA ATAATATTTA ATTTAAAGTT 300 

TTTCAAAATA TTCTCCTTAT AAATTTGAAT TAATATTTAT TAATTTTAGT TCAAATATAT 360 

AATATTACAA TTTAATATCA ATATCAAATA AGTTTAATAT TATTGATATT GAAAATTAAT 420 

TTCATGAGTT TTAGCGGGAT TAGATGCATG AATTTAAAAA TAAAAGTAAT CTCCCTTTTA 480 

AAATATGAAG TGnAACAATT GTTGGATTAA GGGGTTAATC CAGGAnCAGA GGGAATTAGA 540 
AATATAACG - - . ► ^ — * . . .549 
(2) INFORMATION FOR SEQ ID NO: 149: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 544 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 149: 

TTTTGTAATT TTCATATTCA TTAATTAAAT GATAAGACTT CTTTTTTTAA TGaAAAATAA 60^ 

TATTTCAAAA ATAAAATAAG CTCTTTTAGT ATCTTCTTTA CAAAATTCGT AAAACCCTTT 12D- 

GTTTTTTATT AAAATCCTAA TAGACATTTT TCTATTATTT ACTTCAGGCA AATTTTCTTT 180 
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TTTTTACGTT TGATAAATTC TCTTTTAACT GTCTTTGTAT TCCTCTAAAG CCCTATTTTT 240 

TAATTTTATC TATATAAACA GGCCTCCTCT AAAACCCTTT TTCCGTAAAC TTTTTTTGCT 300 

ATACTTTGTA TTAATAAATT TCCTAAAAGG AATTTTAAAA TTTTCTTTTA TTAAATCTTT 360 

AAATACACTT TGATCTTCTT TTATACAAAG GGGAAATACA" TGGCTTGATT CACTGCATCT 420 

ATTTGAAACA AAACATCTCT ATAAAATTCT AGAGGTAAAA GAATGAAAAA AATTATTTGT 480 

CGATAAAAAT CCTGTTGTAA TAAGGGTTAT ATTATTCTCn ATTTCCnAAA TATATTTTTT 540 

TATA 544 



(2) INFORMATION FOR SEQ ID NO: 150: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 533 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 150: 

GAGACTTTGA AGCTATCTCG TCAGGGGTAG TGGAGTCAAT CTTGAAATAC CACCCTTGTT 60 

TAATTAGGTT TCTAACTTAT AGAAATATGA GGAGAGTGCC AGGTGGGTAG TTTGACTGGG 120 

GCGGTCGCCT CCTAAAGAGT AACGGAGGTG CGCAAAGGTT ACCTTAGAGT GGTTGGAAAT 180 

CACTCTGTAA GTGTAAAGGC ATAAGGTAGC TTAACTGTAA GACTGACAAG TCGAACAGAT 240 

ACGAAAGTAG GTCTTAGTGA TCTGGCGGTG GCAAGTGGAA GCGCCGTCAC TTAACGAATA 300 

AAAGGTACTC CGGGGATAAC AGGCTTATCC TTCCCAAGAG TTCACATCGA CGGAAGGgTT 360 

TGGCACcTCG ATGTCGGCTC ATCGCATCCT AGGGcTGGAG CAGgTCCTAA GGGTATGGCT 420 

GTTCGCCATT TAAAGCGGTA CCGAGCTGGG TTCAGAACGT CGTGAGACAG TTTGGTCCCT 480 

ATCTGCCACA AGCGTTGGAT ATTGAGAGGA GCTATnTTAG TACGAGAGGA COG 533 



(2) INFORMATION FOR SEQ ID NO: 151: . 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 521 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SSQ ID NO: 151: 
TGGTTTTGAA GCTTTTTTAG TAGGCTTAGA AGAAATTTTT AGTGAATTTT TAAGAATTTT 60 
ATTTTCATTT AGCACATTTT GATAATCTTG AAATAGTTTG AGCATAAAAT CCATGTTGAA 120 
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ATTATTTAAA TTAAAATAAT TATTAGTGTT CATAAAATCC TCTCCTTGAA GGTGTTACTT 180 

TTAAATTAAG TAAAAGTAAT AAAAATAGAT AAAAATAGTA ATTTATATTG TACCAAAAAC 240 

GAAAAATTTT AGTCAAATTT TGTGAGTTCT CATTGCATGA GAAATTTGGG TTGTAGGGAG 300 

GCTGTTATAA ATAGAATGGG CATTTTCTGA GGGTGTCGGC TAAGAAAGAC TACATACTTT 360 

AGCTAATATA TAGCAAAGAC TTTGAAATTT AATTTGTATG TGTTTTATAG TCTTTTGTAA 420 

TGAGTAGTGC ATTTGCAATG GAGAGATTTT GGGGAGTTGT TTAAAATTAC ATTTGCGTTT 480 

TGTTAAAATG TAACAGCTGA ATGTAACAAA ATTATATATT T 521 
(2) INFORMATION FOR SEQ ID NO: 152: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 501 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double • 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 152: 

GTTCTCAAAT TTTTATAAAT CTTGTTTAGG AATTTTCTTT TTTTCTTTCA ATTGACTTTT 60 

CTAATTTACG CTTTATGTAA CTTAGaTCGC TATATTTATG ATTTTCAATA ATAAAGTGGG 120 

GTTTATATTT GTAATTTTCG TATATTTTTT GAAAATTTGT TTCTAATTGT TCTGAATTGT 180 

ATCCACTTTT TTCTAATTCT TTTTGAGTGT TGCATAGAAT TTTCTTTAAT TTTTCTTGTT 240 

TTTCTTTACT GCAAGATTTA GGAAAGTAAA TATTTTTATT TTTTGCTTTA ATATCAGTTC 300 

TTTTTATGGT TTTAATTATT TTGATCATAG TATCTTaTCA ACATTTAAAT TTAATAAAAT 360 

TGAAAS'AATT tCTTTACATG AAAAGTTGCA TTtATtGAAA TAATTtATtA CTGATACTTT - - 420 - 

CTATTcATTA AcCTTCTTCT cTTTATAtAt TTTATTACTA TTACAGGAnT CACACGTACA 480 

CTACCCATTT TGAACCGAAT T , 501 



(2) INFORMATION FOR SEQ ID NO: 153: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 153: 
GTTCCnCnTT ATCAAGGAAA TTAACGACAT CTTTCATTAT GGTTTCATTT GCAAATTTAA 60 
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CAAAATTGTC TTTTTCTTTT TCTAATCTTT TTCTGAAGTT TTCAAATTCT GCTTGTTTTC 120 

TTAAATACAA ATCTTTAAGA TTGGAGATTT CATTTTCAAG TTCAGCAATT TTTTTATCAG 180 

AATTTACTAA ATTTAAGTTT TCTTTTTTTT GAGATTTTGT ATTTTTATTA TCTTGTTTGT 240 

TGTTTTTTTC AGATTCGCTT TTAGTTTCTT TTTTTTCCAT TTTTCCTCCT kTGATAAAGC 300 

ATTTTATCTT TAAAAAAAAT ATTTTACAAA TTTTnTTCTT TCytGAAATT TAAnAAAATG 3 60 

GAGTCATTTT GnGGCATTTG TAAGATGTAG ATTTTTCTTA AGCTTTCAGT AAGAGTGTTA 420 

TATGnATACA TAGGTTATTT AGTnAAAATG TTCGTGTGTA TTTTGTGTCA AAAGAAAAAA 480 

TTTAAGTT 488 
(2) INFORMATION FOR SEQ ID NO: 154: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 459 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS:. double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 154: 

GGAGAGGCGG TTTGCGTATT GGGCGCTCTT CCGCTTCCTC GCTCACTGAC TCGCTGCGCT 60 

CGGTCGTTCG GCTGCGGCGA GCGGTATCAG CTCACTCAAA GGCGGTAATA CGGTTATCCA 120 

CAGAATCAGG ATAACGCAGA AAGAACATGT GAGCAAAAGG CCAGCAAAAG GCCAGGAACC 180 

GTAAAAAGGC CGCGTTGCTG GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA 240 

AAAATCGACG CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT 300 

TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT ACCGGATACC 360 

TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA TAGCTCACGC TGTAGTATCT 420 

CAGTTCGGTG TAGTCGTTCG CTCCAAGCTG GGCTGTGTG 459 
(2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 368 base pairs 

(B) TYPE: nucleic .acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 
GAACAAGAGT CGAAAGTAGG TGTTAGTGAT sTGGCGGTGG CAAGTGGAAG CGCCGTCACT 
TAACGAATAA AAGGTACTCC GGGGATAACA GGCTTATCCT TCCCAAGAGT TCACATCGAC 



60 
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wo 98/58943 PCT/US98/12764 

1114 

GGAAGGGTTT GGCACCTCGA TGTCGGCTCA TCGCATCCTA GGGCTGGAGC AGGTCCTAAG 180 

GGTATGGCTG TTCGCCATTT AAAGCGGTAC GCrAGCTGGG TTCAGAACGT CGTGAGACAG 240 

TTTGGTCCCT ATCTGCCACA AGCGTTGGAT ATTTGAGAGG AnCTATCTTT AGTACGAGAG 300 

GACCGAGATG GACGAACCTC TAGTGTGCCA GTTATCCTGC CAAGGGTAAG TGCTGGGTAG 360 

CTACnTTC 368 
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INDICATIONS RELATING TO A DEPOSITED MICROORGANISM 

(PCT Rule \2bisj 



A. . The indications made below relate to the microorganism referred to in the description 
. on page 8 . line 23 

B. IDENTinCATION OF DEPOSIT Funher deposits are identif.ed on an additional shee; 
Name of depositaiy institution 

American Type Culture Collection 

Address of depositary institution (including postal code and country) 

12301 Parklawn Drive 
Rockville. Maryland 20852 
United States of America 



Date or deposit August 8. 1997 


Accession N umbtf r 2020 1 2 


C. ADDITIONAL INDICATIONS lieave blank tf not applicabiej This inibrmaiion is continued on an additional sheet — 



EUROPE 

In respect of those designations in which a European Patent is soushi a sample of the deposited microoraanism will be 
available until the publication of the mention of the grant of the European patent or until the date on whfch the application 
has been refused or withdrawn or is deemed to be withdrawn, onlv bv the issue of such a sample to an expen nominated 
bv the person requesting the sample (Rule 28(4)EPC). 



D. DESIGNATED STATES FOR WHICH INDICATIONS ARE MADE (if the indicmions are not far aU designated Siotes) 



E. SEPARATE FURNISHING OF INDICATIONS Heave blank if noi applicable) 



The indications listed bciow wilt be submined to the Inienuitional Bureau later upectjy the general namre of the tndicauons, e.g.. Accession 
Number of Deptuit'^ 



For receiving Office use only , 



This sheet was received with the inicmaiional applieation 



Authorized otVtcer 



• For International Bureau use onK 



□ 



This sheet was received by ihe Imemaiiona! Bureau on. 



Authorized of ficer 
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CANADA 

The applicant requests that, until either a Canadian patent has been issued on the basis of an 
application or the application has been refused, or is abandoned and no longer subject to 
reinstatement, or is withdrawn, the Commissioner of Patents only authorizes the fumishing of 
a sample of the deposited biological niaterial referred to in the application to an independent 
expert nominated by the Commissioner; the applicant must, by a >yritten statement, inform the 
International Bureau accordingly before completion of technical preparations for publication 
of the international application. 

NORWAY 

The applicant hereby requests that the application has been laid open to public inspection (by 
the Norwegian Patent Office), or has been finally decided upon by the Norwegian Patent 
Office without having been laid open inspection, the fumishing of a sample shall only be 
effected to an expert in the art. The request to this effect shall be filed by the applicant with 
the Norwegian Patent Office not later than at the time when the application is made available 
to the public under Sections 22 . and 33(3) of the Norwegian Patents Act. If such a request has 
been filed by the applicant, any request made by a third party for the fumishing of a sample 
shall indicate the expert to be used. That expert may be any person entered on the list of 
recognized experts drawn up by the Norwegian Patent Office or any person approved by the 
applicant in the individual case. 

AUSTRALIA 



The applicant hereby gives notice that the fumishing of a sample of a microorganism shall 
only be effected prior to the grant of a patent, or prior to the lapsing, refusal or withdrawal of 
the application, to a person who is a skilled addressee without an interest in the invention 
(Regulation-3.25(3) of the Australian Patents Regulations). 

FINLAND 

The applicant hereby requests that, until the application has been laid open to public 
inspection (by the National Board of Patents and Regulations), or has been finally decided 
upon by the National Board of Patents and Registration without having been laid open to 
public inspection, the fumishing of a sample shall only be effected to an expert in the art. 

UNITED KINGDOM 

The applicant hereby requests that the fumishing of a sample of a microorganism shall only 
be made available to an expert. The request to this effect must be filed by the applicant with 
the International Bureau before the completion of the technical preparations for tiie 
intemational publication of the application. 
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DENMARK 

The applicant hereby requests that, until the application has been laid open to public 
inspection (by the Danish Patent Office), or has been finally decided upon by the Danish 
Patent office without having been laid open to public inspection, the furnishing of a sample 
shall only be effected to an expert in the art. The request to this effect shall be filed by the 
applicant with the Danish Patent Office hot later that at the time when the application is made 
available to the public under Sections 22 and 33(3) of the Danish Patents Act. If such a 
request has been filed by the applicant, any request made by a third party for the furnishing of 
a sample shall indicate the expert to be used. That expert may be any person entered, on a list 
of recognized experts drawn up by the Danish Patent Office or any person by the applicant in 
the individual case. 

SWEDEN 

The applicant hereby requests that, until the application has been laid open to public 
inspection (by the Swedish Patent Office), or has been finally decided upon by the Swedish 
Patent Office without having been laid open to public inspection, the furnishing of a sample 
shall only be effected to an expert in the art. The request to this effect shall be filed by the 
applicant with the Intemational Bureau before the expiration of 16 months fi-om the priority 
date (preferably on the Form PCT/RO/134 reproduced in annex Z of Volume I of the PCT 
Applicant's Guide). If such a request has been filed by the applicant any request made by a 
third party for the furnishing of a sample shall indicate the expert to be used. That expert may 
be any person entered on a list of recognized experts drawn up by the Swedish Patent Office 
or any person approved by a applicant in the individual case. 



NETHERLANDS 

The applicant hereby requests that until the date of a grant of a Netherlands patent or until the 
date on which the application is refused or withdrav^ or lapsed, the microorganism shall be 
made available as provided in the 3 1F(1) of the Patent Rules only by the issue of a sample to 
an expert. The request to this effect must be furnished by the applicant with the Netherlands 
Industrial Property Office before the date on which the application is made available to the 
public under Section 22C or Section 25 of the Patents Act of the Kingdom of the Netherlands, 
whichever of the two dates occurs earlier. 
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1. An isolated nucleic acid molecule comprising a polynucleotide having a nucleotide sequence 
selected from the group consisting of: 

(a) any one nucleotide sequence of SEQ ID NOS: 1-155; or 

(b) a nucleotide sequence complementary to any one of the nucleotide sequences in (a). 

(c) a nucleotide sequence at least 95% identical to any one of the nucleotide sequences of 
SEQ ID NOS: M55; or, 

(d) a nucleotide sequence at least 95% identical to a nucleotide sequence complementary to 
any one of the nucleotide sequences of SEQ ID NOS: 1 - 1 55. 

2. An isolated nucleic acid molecule of claim 1 comprising a polynucleotide which hybridizes 
under stringent hybridization conditions to a polynucleotide having a nucleotide sequence identical 
to a nucleotide sequence in (a) or (b) of claim 1. 

3. An isolated nucleic acid molecule of claim 1 comprising a polynucleotide which encodes an 
epitope-bearing portion of a polypeptide in (a) of claim L 

4. Computer readable medium having recorded thereon the nucleotide sequence depicted in SEQ 
ID NOS: 1-155, a representative fragment thereof or a nucleotide sequence at least 95% identical to 
a nucleotide sequence depicted in SEQ ID NOS: 1-155. 

5. A method for making a recombinant vector comprising the step of inserting an isolated nucleic 
acid molecule of claim 1 into a vector. 

6. A recombinant vector produced by the method of claim 5. 

7. A host cell comprising the vector of claim 6. 

8. A method of producing a polypeptide comprising: 

(a) growing the host cell of claim 7 such that the protein is expressed by the cell; and 

(b) recovering the expressed polypeptide. 

9. An isolated polypeptide comprising a polypeptide selected from the group 

consisting of : , • 

(a) apolypeptideencodedby an ORF of any one sequence of SEQ ID NOS: 1-155; ; . 

(b) a polypeptide encoded by an ORF of any one sequence of SEQ ID NOS: 1-155 exckpi 
the N-terminal residue; 
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(c) a fragment of the polypeptide of (a) having biological activity; and 

(d) an epitope-bearing fragment of the polypeptide of (a). 

10. An isolated antibody specific for the polypeptide of claim 9. 

1 1 . A polypeptide produced according to the method of claim 8. 

12. An isolated polypeptide comprising an amino acid sequence at least 95% identical to a 
sequence selected from the group consisting of an amino acid sequence of any one of the 
polypeptides in Table 1. 

13. An isolated polypeptide antigen comprising an amino acid sequence of an B, burgdorferi 
epitope shown in Table 4. 

14. An isolated nucleic acid molecule comprising a polynucleotide with a nucleotide sequence 
encoding a polypeptide of claim 9. 

15. A host cell which produces an antibody of claim 10. 

16. A vaccine, comprising: 

(1) one or more B. burgdorferi polypeptides selected from the group consisting of a 
polypeptide of claim 9; and 

(2) a phjarmaceutically acceptable diluent, carrier, or excipient; 

wherein said polypeptide is present, in an amount effective to elicit protective antibodies 
in an animal to a member of the Borrelia genus. 

17. A method of preventing or attenuating an infection caused by a member of the Borrelia genus 
in an animal, comprising administering to said animal a polypeptide of claim 9, wherein said 
polypeptide is administered in an amount effective to prevent or attenuate said infection. 

18. A method of detecting Borrelia nucleic acids in a biological sample comprising: 

(a) contacting the sample with one or more nucleic acids of claim 1, under conditions 
such that hybridization occurs, and 

(b) detecting hybridization of said nucleic acids to the one or more Borrelia nucleic acid 
sequences present in the biological sample. 



19. A method of detecting Borrelia nucleic acids in a biological sample obtained'from an animal, 
comprising: 
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(a) amplifying one or more Borrelia nucleic acid sequences in said sample using 
polymerase chain reaction, and 

(b) detecting said amplified fiorr^/iVi nucleic acid. 

20. A kit for detecting Borrelia antibodies in a biological sample obtained from an animial, 
comprising 

(a) a polypeptide of claim 9 attached to a solid support; and 

(b) detecting means. 

21 . A method of detecting Borrelia antibodies in a biological sample obtained from an animal, 
comprising 

(a) contacting the sample with a polypeptide of claim 9; and 

(b) detecting antibody-antigen complexes. 
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US CL :435/69.1. 71.1, 172.3; 536/23.1, 23.7. 24.3, 24.32 
According to International Patent Classification (IPC) or to both national classification and IPC 



B. FIELDS SEARCHED 



Minimum documentation searched (classification system followed by classification symbols) 
U.S. : 435/69.1. 71.1. 172.3; 536/23.1, 23.7. 24.3. 24.32 



Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched 



Electronic data base consulted during the international search (name of data base and, where practicable, search terms used) 
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BARBOUR, A.G. et al. The nucleotide sequence of a linear plasmid 
of Borrelia burgdorferi reveals similarities to those of circular 
plasmids of other prokaryotes. Journal of Bacteriology. 1996, Vol. 
178, No. 22, pages 6635-6639, see entire document, especially 
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ERASER, CM. et al. Genomic Sequence of a Lyme disease 
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Vol. 390, pages 580-S86, see entire document, especially sequences. 
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document referring to on oral disclosure, use. exhibition or other 
means 

document published prior to the in'tsmational filing date but later than 
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later document published after the interaalional filing date or prioriQr 
date and not in conflict with the application but citad to understand 
the principle or theory underlying the invention 

document of particular relevance; the claimed invention cannot be 
considered novel or cannot be considered to involve an inventive step 
when the document b taken alone 

document of particular relevance; the claimed invention cannot be 
considered to involve an inventive step when the document is 
combined with one or more other such documents, such combination' 
being obviotu to a person skilled in the art 

document member of the same patent family 
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Box I Observations where certain claims %vere Tound unsearchable (Continuation of item 1 of first sheet) 



This international rqport has not been established in respect of ceitain claims under Axticle 17(2)(a) for the following reasons: 

1. Claims Nos.: 4 

^—^ because they relate to subject matter not required to be searched by this Authority, namely: 

Please See Extra Sheet. 



2. I j Claims Nos.: 

' — ' because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out» specifically: 



3. I I Claims Nos.: 

because th^ are dependent claims and are not draRed in aooordanoe with the second and third sentences of Rule 6.4(a). 



Box 11 Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This International Searching Authority found multiple inventions in this international application^ as follows: 
Please See Extra Sheet. 



1 . I I As all required additional search fees were timely paid by the applicant, this international search rqport covers all searchable 

claims. 

2. I \ As all searchable claims could b^ searched withoiireffori justifying an additiuiial fee, this Authority did not invite payment 

of any additional fee. 

3. I I As only some of the required additional search fees were timely paid by the applicant, this international seafx:h report covers 

only those claims for which fees were paid, specifically claims Nos.: 



4. [ x| No required additional search fees were timely paid by the applicant. Consequently, this international search report is 
restricted to the invention first mentioned in the claims; it is covered by claims Nos.: 
1-3, 5-S, and 14 



Remark on Protest | | The additional search fees were accompanied by the applicant's protest. 

I I No protest accompanied the payment of additional search fees. 
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B. FIELDS SEARCHED 

Electronic data bases consulted (Name of data base and where practicable terms used): 
Databases: Genbank, APS 

Search Terms: sequence search of claimed sequences including only first, middle, and last 100 bases of each of the first 
ten sequences; open; read?; frame?; orf; protein?; borreiia? 

BOX L OBSERVATIONS WHERE CLAIMS WERE FOUND UNSEARCHABLE 
1. Subject matter not required to be searched by this ISA, namely: 

The subject matter of claim 4 is directed to a "computer readable medium** having recorded thereon nucleotide sequence 
information. However, under PCT Rule 39. the International Searching Authority is not required to search an invention 
that is drawn to '*mere presentations of information" (See Rule 39.1 (v)). Therefore, claim 4 has not been considered 
by this authority. 

BOX II. OBSERVATIONS WHERE UNITY OF INVENTION WAS LACIGNG 
This ISA found multiple inventions as follows: 

This application contains the following inventions or groups of inventions which are not so linked as to form a single 
inventive concept under PCT Rule 13.1. 

Group I: 

Claims 1-3, 5-8, and 14, drawn to a polynucleotide selected from SEQ ID NOs 1-155 and associated vectors, 
host cells, and methods of making proteins. This group includes the first method making the claimed vectors (claim 5) 
and the first method of use of the cells (claim 8) to make a product. There are a total of 155 polynucleotide sequences 
of which the first 10 are selected for examination and therefore, there are 37 remaining additional groups of 4 
polynucleotide sequences. 



Group II: 

Claims 9, 11-13, and 16, drawn to polypeptides and/or fragments thereof with the amino acid sequence 
defined by SEQ ID NOs 1-155. Within this group there are a total of 155 polypeptide sequences and therefore 154 
additional species of proteins. . 

Group III: 

Claims 10 and 15, drawn to an antibody that binds to a polypeptide with the amino acid sequence defined by 
SEQ ID NOs: 1-155. Within this group there are a total of 155 antibodies and therefore 154 additional species of 
antibody proteins. 

Group IV: 

Claim 17, drawn to a process of preventing, treating, or attenuating and infection caused by a member of the 
Borreiia genus by administering a polypeptide of group U which is a second/alternative process of use of the second 
product. 

In Group IV, and where additional fees are paid, the claims are searched only insofar as they are applicable to 
the selected polypeptide as the first species as directed to a process practiced using a polypeptide. There are 154 
additional polyp^tide species of proteins. 

Group V: 

Claim 18 and 19, drawn to a method of detection of a Borreiia nucleic acid using the nucleic acids of the 
invention of group I. This method is a second process of use of the first claimed product in Group I. Additionally 
Group V contains indica that there are a total of 155 polynucleotide sequences and therefore, nine(9) additional groups 
of four (4) polynucleotide sequences beyond the first ten (10) sequences. 

Group VI: 



Claims 20 and 21, drawn to a method of detecting antibodies in biological samples using the proteins of the 
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invention of group II. This is an alternative process of use of the polypeptides. There appear to be a total of 155 
polypeptide sequences and therefore 154 additional species of the use f these proteins. 

The inventions listed as Groups I- VI do not relate to a single inventive concept under PCT Rule 13.1 because, 
under PCT Rule 13.2, they lack the same or corresponding special technical features for the following reasons: 

Claims of Group I are drawn to nucleotides, nucleotide constructs, and/or methods requiring the use of 
nucleotides or nucleotide constructs that contain more than ten individual, independent, and distinct nucleotide 
sequences in alternative form. Accordingly, these claims are subject to lack of unity as outlined in 1192 O.G. 68 (19. 
November 1996). 

For Group 1, the first ten (10) of the individual polynucleotide sequences are designated as SEQ ID NOs 1-10. 
The search of the no more than ten sequences may include the complements of the selected sequences and, where 
appropriate, may include subsequences within the selected sequences (e.g., oligomeric probes and/or primers). 
Similarly, the invention of Group V encompasses the use of multiple independent and distinct proteins that are 
encompassed within the referenced O.G. notice. 

In Group 1 1- IV and VI (as directed to the species which are polynucleotides or antibodies) should applicant 
pay the additional fee for the examination/search of any of these inventions, additional fees will be required for 
consideration of each of the species of proteins and/or antibodies after the first of each. 

^ Where Applicant may elect to pay additional fees for a search of sequences beyond the initial ten (10) 
polynucleotide sequences, and in accordance with 1192 O.G. 68 (19 November 1996), applicant may select additional 
groups of polynucleotides consisting of four (4) sequences beyond the initial ten (10) sequences for Group I which 
would then be searched with Group I upon payment of the requisite fees for the requisite Groups beyond Group I. 

As to the polypeptides and antibodies of Groups 11, III, IV and VI, (as directed to different species of 
polypeptides and antibodies) each is a distinct and different protein with no requisite structural or functional 
relationship. 

The special technical feature of the invention of group I is directed to nucleic acids that are prepared from a 
bacterial genome. This special technical feature encompasses nucleic acids that are not per se required to encode 
proteins and may be used in multiple independent manners. For example, the nucleic acids may be used as probes to 
detea bacterial infections. In contrast, the special technical feature of the inventions of groups II-IV and VI encompass 
proteins and antibodies which are materially distinct molecules with no functional or structural relationship with the 
claimed nucleic acids. Similarly, multiple uses of the claimed nucleic acids are claimed (see groups I and V) and such 
bear no requisite structural linkage. For example, the invention of group I requires the use of nucleic acids that encode 
proteins whereas the invention of group v only requires that organisms contain sequences that hybridize with those 
.claimed. _ ^. . ^ . . 

Therefore, the separately claimed compositions and methods of using such are not so linked by any single 
special technical feature within the meaning of PCT Rule 13.2 so as to form a single inventive conc^. 
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